OpenAI и Handshake AI ищут подрядчиков для сбора данных

OpenAI Handshake AI

Об этом сообщает KURAZH

OpenAI совместно с компанией Handshake AI, специализирующейся на подготовке данных для искусственного интеллекта, инициировали сотрудничество с внешними подрядчиками с целью улучшения своих датасетов. Их главной задачей является сбор примеров реальных задач, которые выполнялись в предыдущих и текущих проектах.

Какие материалы собирают для обучения ИИ

Подрядчикам предлагается подробно описать свои рабочие задания и предоставить оригинальные «исходные файлы», созданные в процессе выполнения этих заданий. Речь идет не о стандартных резюме, а о реальных документах в форматах Word, PDF, Excel, презентациях, изображениях, а также программном коде из различных репозиториев. Такие материалы должны стать основой для создания качественных датасетов, которые позволят моделям искусственного интеллекта лучше имитировать деятельность офисных работников.

Защита персональных данных и риски

Перед тем как передавать документы, подрядчиков призывают удалять из них конфиденциальную и персональную информацию. Для этого рекомендуется использовать специальный инструмент Superstar Scrubbing, доступный в ChatGPT. Однако специалисты предупреждают о потенциальных угрозах такой практики.

Известный юрист в сфере интеллектуальной собственности Эван Браун подчеркивает: «такая практика является рискованной и требует чрезмерного доверия к подрядчикам, которые сами решают, что является конфиденциальным».

Стоит отметить, что OpenAI в настоящее время воздерживается от каких-либо официальных комментариев по этой инициативе.