
Про це розповідає KURAZH
OpenAI спільно з компанією Handshake AI, яка спеціалізується на підготовці даних для штучного інтелекту, ініціювали співпрацю із зовнішніми підрядниками з метою вдосконалення своїх датасетів. Їхньою головною задачею є збір прикладів реальних завдань, які виконувалися у попередніх і поточних проєктах.
Які матеріали збирають для навчання ШІ
Підрядникам пропонується детально описати свої робочі завдання і надати оригінальні «вихідні файли», що були створені під час виконання цих завдань. Йдеться не про стандартні резюме, а про реальні документи у форматах Word, PDF, Excel, презентації, зображення, а також програмний код з різних репозиторіїв. Такі матеріали мають стати основою для побудови якісних датасетів, які дозволять моделям штучного інтелекту краще імітувати діяльність офісних працівників.
Захист персональних даних та ризики
Перед тим, як передавати документи, підрядників закликають видаляти з них конфіденційну та персональну інформацію. Для цього рекомендується використовувати спеціальний інструмент Superstar Scrubbing, який доступний у ChatGPT. Однак, фахівці попереджають про потенційні загрози такої практики.
Відомий юрист у сфері інтелектуальної власності Еван Браун наголошує: «така практика є ризикованою і вимагає надмірної довіри до підрядників, які самі вирішують, що є конфіденційним».
Варто зазначити, що OpenAI наразі утримується від будь-яких офіційних коментарів щодо цієї ініціативи.