Rachel, Kinh tế Vàng
Vào ngày 27 tháng 11, Zhao Changpeng đã đăng bài trên X cho biết, các nhiệm vụ như gán nhãn dữ liệu AI rất phù hợp để thực hiện thông qua blockchain, có thể tận dụng lực lượng lao động giá rẻ toàn cầu và thanh toán ngay lập tức bằng tiền điện tử, phá vỡ giới hạn địa lý.
Ghi nhãn dữ liệu là việc gán nhãn cho dữ liệu gốc (như văn bản, hình ảnh, âm thanh, v.v.) bằng cách thủ công hoặc tự động, để nó có thông tin cấu trúc cụ thể. Dữ liệu đã được ghi nhãn được sử dụng để đào tạo các mô hình học máy hoặc trí tuệ nhân tạo, ví dụ như việc ghi nhãn cảm xúc cho văn bản (tích cực, tiêu cực, trung lập) là một dạng ghi nhãn dữ liệu. Việc sử dụng blockchain cho ghi nhãn dữ liệu trí tuệ nhân tạo đặc biệt phù hợp với những tình huống ghi nhãn dữ liệu cần có tính minh bạch cao, độ tin cậy và hợp tác phân tán. Điều này không chỉ nâng cao hiệu quả và chất lượng ghi nhãn dữ liệu mà còn tạo ra những khả năng mới cho hợp tác toàn cầu và giao dịch dữ liệu.
Hiện tại, trong lĩnh vực này có những dự án chất lượng nào? Triển vọng phát triển của lĩnh vực này ra sao?
Vai trò của blockchain trong việc gán nhãn dữ liệu AI
Công nghệ blockchain là một công nghệ sổ cái phân tán phi tập trung, có các đặc điểm như tính minh bạch, tính không thể sửa đổi và tính khả năng truy xuất. Những đặc điểm này có thể giải quyết các vấn đề sau trong các phương pháp truyền thống về việc đánh dấu dữ liệu:
Ứng dụng
Dự án liên quan
OORT DataHub: Cung cấp dịch vụ chú thích dữ liệu phi tập trung dựa trên blockchain sử dụng thuật toán Proof of Honest để kiểm soát chất lượng. Nền tảng của nó phân phối các nhiệm vụ, xem xét chất lượng dữ liệu và thanh toán thông qua các hợp đồng thông minh, thu hút người chú thích toàn cầu, đồng thời đảm bảo tính minh bạch và bảo vệ quyền riêng tư của dữ liệu chú thích.
Mô hình kinh tế của token dự án như sau:
Phần thưởng cộng đồng*: Bằng cách tham gia vào việc gán nhãn và phân tích dữ liệu, người dùng có thể nhận được phần thưởng bằng token $OORT. Ngoài ra, còn có thể nhận được NFT độc đáo liên quan đến đóng góp, những NFT này cung cấp quyền lợi bổ sung, chẳng hạn như phần thưởng nâng cao tỷ lệ lợi nhuận hàng năm (APY), giảm giá thiết bị và quyền biểu quyết DAO.*
Đặt cọc nhiệm vụ*: Người tham gia cần đặt cọc ít nhất 210 $OORT token để thể hiện cam kết đối với nhiệm vụ, sau khi hoàn thành nhiệm vụ sẽ hoàn trả token và phát thưởng.
Chia sẻ doanh thu bán hàng*: Một số chủ sở hữu NFT còn có thể nhận cổ tức từ doanh thu bán dữ liệu trong tương lai, nâng cao lợi nhuận dài hạn.
Mô hình kinh tế của token dự án như sau:
***Phần thưởng cộng đồng:10% token Public sẽ được sử dụng cho phần thưởng airdrop cho người dùng trong giai đoạn đầu tương tác, cụ thể cóba phương pháp để nhận airdrop,****trở thành AI Builder: thu thập nội dung internet chất lượng cao;*trở thành AI Validator: xác minh nội dung đã thu thập; trở thành AI Developer: sử dụng bộ dữ liệu đã xác minh để đào tạo đại lý AI.
Phân bổ token***:****Dự án đã hoàn thành vòng gọi vốn hạt giống trị giá 2 triệu USD vào tháng 1 năm 2024, các nhà đầu tư bao gồm IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital và nhiều giáo sư nổi tiếng trong lĩnh vực trí tuệ nhân tạo, hiện tại chi tiết phân bổ token PublicAI vẫn chưa được xác định.
Những thách thức phải đối mặt
Hiện tại, có vài yếu tố kìm hãm sự phát triển của lĩnh vực này: thứ nhất là việc gán nhãn dữ liệu AI cần nhiều tài nguyên tính toán và lưu trữ; thứ hai là hiệu suất của dự án bị giới hạn bởi khả năng mở rộng của blockchain; thứ ba là tiêu chuẩn hóa công nghệ và quy định vẫn chưa hoàn thiện.
Thứ hai trong số này có lẽ là thách thức lớn nhất vào lúc này. Điều này là do việc ghi nhãn dữ liệu AI và đào tạo mô hình thường yêu cầu nhiều tài nguyên tính toán và các nút trong mạng blockchain có sức mạnh tính toán hạn chế. Trên tiền đề đảm bảo tính phi tập trung của blockchain, làm thế nào để tích hợp và sử dụng hiệu quả tài nguyên điện toán phân tán đáp ứng nhu cầu tính toán của các dự án ghi nhãn dữ liệu AI là bài toán cấp bách cần giải quyết. Có thông tin cho rằng Greenfield, một công ty con của Binance, đang cung cấp hỗ trợ lưu trữ cho đường đua này và hy vọng sẽ có nhiều tài nguyên lưu trữ và tính toán hơn để thực hành trong lĩnh vực này.