
Об этом сообщает KURAZH
OpenAI совместно с компанией Handshake AI, специализирующейся на подготовке данных для искусственного интеллекта, инициировали сотрудничество с внешними подрядчиками с целью улучшения своих датасетов. Их главной задачей является сбор примеров реальных задач, которые выполнялись в предыдущих и текущих проектах.
Какие материалы собирают для обучения ИИ
Подрядчикам предлагается подробно описать свои рабочие задания и предоставить оригинальные «исходные файлы», созданные в процессе выполнения этих заданий. Речь идет не о стандартных резюме, а о реальных документах в форматах Word, PDF, Excel, презентациях, изображениях, а также программном коде из различных репозиториев. Такие материалы должны стать основой для создания качественных датасетов, которые позволят моделям искусственного интеллекта лучше имитировать деятельность офисных работников.
Защита персональных данных и риски
Перед тем как передавать документы, подрядчиков призывают удалять из них конфиденциальную и персональную информацию. Для этого рекомендуется использовать специальный инструмент Superstar Scrubbing, доступный в ChatGPT. Однако специалисты предупреждают о потенциальных угрозах такой практики.
Известный юрист в сфере интеллектуальной собственности Эван Браун подчеркивает: «такая практика является рискованной и требует чрезмерного доверия к подрядчикам, которые сами решают, что является конфиденциальным».
Стоит отметить, что OpenAI в настоящее время воздерживается от каких-либо официальных комментариев по этой инициативе.