Thứ Tư, 11 tháng 12, 2019

Gán nhãn dữ liệu và những trường hợp thường gặp

Gán nhãn dữ liệu

Gán nhãn dữ liệu là quá trình gắn trường ý nghĩa cho các loại dữ liệu kỹ thuật số khác nhau như tệp âm thanh, văn bản, hình ảnh, video và nhiều loại khác.
Đó là một quá trình mất nhiều thời gian, vì nó liên quan đến sự tương tác của con người để có kết quả chính xác nhất.
Chính vì vậy mà có rất nhiều bài toán khác nhau của gán nhãn dữ liệu, dưới đây là một số trường hợp thường gặp:

Gán nhãn từ loại (POS tagging)

Là xác định các chức năng ngữ pháp của từ trong câu. Đây là bước cơ bản trước khi phân tích sâu văn phạm hay các vấn đề xử lý ngôn ngữ phức tạp khác.
Thông thường, một từ có thể có nhiều chức năng ngữ pháp, ví dụ:
Trong câu "con ngựa đá con ngựa đá", cùng một từ "đá" nhưng ở từ thứ nhất giữ chức năng động từ, nhưng từ thứ hai lại là danh từ.
Gán nhãn từ loại được xem là cơ sở phục vụ cho các bài toán về ngữ nghĩa cao hơn.

Gán nhãn tên thực thể (Named-Entity recognition)

Ví dụ: bà ba [CON NGUOI] bán bánh mì [THUC PHAM] ở phường 13 [DIA DIEM]
Có giá trị về mặt ngữ nghĩa ở mức trung bình, thường được dùng đêt phân lớp văn bản

Dịch máy (Machine translation)

Đầu vào là một câu của ngôn ngữ A, đầu ra là câu của ngôn ngữ B tương ứng. Trường hợp này đã xảy ra rất nhiều trong chiến tranh thế giới thứ 2, khi mà thông tin tình báo của địch cần được dịch trong thời gian ngắn nhất, giúp cho các lãnh đạo có thể đưa ra những chiến lược cấp thiết.

Nhận diện tiếng nói (Speech recognition) 

Đầu vào là âm thanh dạng tiếng nói, đầu ra là dạng văn bản. Theo thống kê từ Apple, người dùng thích sử dụng tiếng nói của mình để nhập văn bản hơn là cách nhập dữ liệu bằng bàn phím như truyền thống, đồng thời tương tác giữa người và máy theo cách này có tốc độ nhập liệu nhanh hơn.

0 nhận xét:

Đăng nhận xét