Получение списка информации о тонких настройках от OpenAI
Допустим, у вас есть еще файлы, которые сейчас дорабатываются. Что вы собираетесь делать? Проверять каждый из них за раз может быть скучно, поэтому есть возможность перечислить их все.
Создайте запрос в Postman как «GET» с URL: https://api.openai.com/v1/fine-tunes.
Вы можете назвать его как-нибудь вроде «List fine-tunes».
В «Headers» добавьте «Authorization» и «API KEY». — Затем просто нажмите «send».

Наш конечный результат должен быть «200 OK», а ответ от OpenAI отобразит детали ваших тонко настроенных данных.
Там будет список всех тонких настроек, которые у вас есть (если у вас их много).
Вот и все. Теперь вам остается только ждать, пока ваш файл будет обработан OpenAI и появится в Playground.
Вот как это будет выглядеть:

Ваш обученный файл появится там, когда он будет готов. Просто нажмите на него и разверните.
Заключительное задание - создание набора данных для нашего случая использования!
Ну вот, началось! Это, несомненно, самая сложная часть обучения ИИ — писать для нас. Она требует времени и исследований.
После установки visual studio мы готовы идти вперед и создавать наши наборы данных.
Зачем? Чтобы мы могли предоставлять их по мере изучения в OpenAI и обучать нашу модель.
Автоматический ввод данных может быть неточным и привести к ошибкам в ваших наборах данных.
Создавая свои наборы данных вручную, вы можете обеспечить точность и надежность данных.
Кроме того, у вас есть полный контроль над подсказками и ответами, поэтому вы можете настроить их в соответствии с вашими конкретными потребностями.

Вот так выглядит Visual studio.
Теперь, помните, я дал вам файл paragraphs.JSONL для загрузки, когда мы загружали фиктивные данные?
Если он все еще у вас, мы будем использовать его здесь. Если нет, просто поищите ссылку в начале статьи. Ссылка там!
Этот файл содержит некоторые данные из моего генератора «paragraph». Это всего лишь крошечная часть, чтобы вы могли привыкнуть к набору данных.
В visual studio -> перейдите в -> File -> Open File — > Open paragraphs.JSONL

Странно, да? Я знаю. Сначала меня тоже трясло. Что это такое? Что я могу сделать с этим?
Вот документация OpenAI об этом:
https://beta.openai.com/docs/guides/fine-tuning/preparing-your-dataset
Вот как должен выглядеть набор данных:
{«prompt»:»Company: BHFF insurance\nProduct: allround insurance\nAd:One stop shop for all
your insurance needs!\nSupported:», «completion»:» yes»}
{«prompt»:»Company: Loft conversion specialists\nProduct: -\nAd:Straight teeth in
weeks!\nSupported:», «completion»:» no»}
Программа, которая преобразует текст в строку? Та, что выше, находится в разделе «tools». Это ваш спаситель.
Как вы видите, наборы данных формируются из «prompt» и «“completion», что означает «идеальный сгенерированный текст» — то, как должен выглядеть сгенерированный текст. Это то, чему вы обучаете искусственный интеллект.
Давайте разберем это на примере моего генератора абзацев. Для этого я использовал Jasper.AI
Для формирования нашей подсказки + завершения. Посмотрите на это ->

Взгляните на него. Видите, как она сформирована?
Вот как эта подсказка будет выглядеть для написания ИИ текста:
О чем ваш абзац: Как заработать деньги в Интернете с помощью YouTube
Ключевые слова(Keywords): Заработать деньги в Интернете
Тон голоса(The tone of voice): Информативный (Informative)
Абзац(Paragraph): *Здесь ИИ будет генерировать желаемый результат после обучения*.
Начинаете понимать?
Вот как выглядит базовый вариант (без подсказки и завершения prompt and completion):

Если разбить это на части, то мы говорим ИИ, о чем параграф, ключевые слова, которые мы хотим, чтобы он использовал, тон голоса и, в конце концов, желаемый результат (завершение).
Я знаю, что это может показаться немного сложным, но поверьте мне, немного времени и вы сможете создавать вещи вроде «генератор абзацев», «AIDA-маркетинг», «генератор статей» и т.д.
И поскольку моя модель уже прошла обучение, вот как она будет выглядеть на игровой площадке OpenAI.

Как вы можете видеть, ваша обученная модель появится в разделе «Тонкие настройки». Таким образом, все, что вам нужно сделать, это
следовать инструкциям модели, которые вы использовали в обучающем файле.
Для нашего примера с (paragraph generator)»генератором абзацев» это будет следующее:

Разве это не прекрасно? Высококачественный контент за считанные секунды! И файл, используемый для обучения
искусственного интеллекта. Представьте себе, что можно сделать с действительно ХОРОШИМИ наборами данных. БУМ! Взрыв! Создавайте!
Создание своего кастомного датасета
Теперь, когда у вас есть представление о том, как происходит создание набора данных на основе вашего сценария, использовать его
не так уж и сложно.
Если вы будете следовать шаблонам файле, который я вам дал, ничто не помешает вам.
Однако для этого руководства я покажу вам один пример.
Допустим, вам нужен генератор AIDA (Attention, Interest, Desire, Action) маркетинговой тактики.
Для этого примера мы сделаем обратную разработку подсказки AIDA от Jasper AI.
Вот как будет выглядеть набор данных:

Разбираем как сделать:
Company: Jasper
Product Description: Jasper AI — это помощник по написанию текстов с искусственным интеллектом, который помогает вам писать контент быстрее,
лучше и проще.
Tone of voice: engaging
AIDA Generated(Completion): «Внимание: Чувствуете себя подавленным мыслью о написании блога, поста, статьи или даже электронного письма?
Интерес: Jasper AI здесь, чтобы помочь! Этот ИИ-ассистент возьмет на себя всю утомительную работу за вас, чтобы вы могли сосредоточиться на главном — создании контента, который привлечет вашу аудиторию.
Желание: Писать не обязательно должно быть сложно. С помощью искусственного интеллекта Jasper AI вы сможете писать как профессионал в кратчайшие сроки.
Кроме того, наше программное обеспечение постоянно учится и развивается, поэтому ваш контент всегда будет свежим и оригинальным.
Действуйте: Зарегистрируйтесь на бесплатную пробную версию сегодня и узнайте, как Jasper AI может помочь вам писать лучший контент быстрее!»
Вот что сгенерировал Jasper при использовании своего фреймворка AIDA.
Все, что я сделал с текстом, это прогнал его через инструмент, преобразующий текст в строки JSON (см. инструменты
выше) и ввести его в «completion». Часть тонкой настройки сделана.
Вот как OpenAI говорит вам форматировать наборы данных:
{«prompt»: «<prompt text>», «completion»: «<ideal generated text>»}
{«prompt»: «<текст подсказки>», «завершение»: «<идеальный сгенерированный текст>»}
Допустим, вы хотите, чтобы ИИ писал описания товаров. Посмотрите, как я превращаю одну из приведенных выше строк
в подсказку для обучения ИИ.
Вы можете начать с того, что спросите себя: «Как я хочу отформатировать это?».
Итак, у нас всегда {«prompt»: «затем текст подсказки,» за которым следует завершение (ваш идеальный текст
для обучения ИИ), «завершение»: «Здесь вы вводите качественный обучающий контент»}
Звучит просто? Надеюсь, что да, и так оно и есть, когда вы вникаете в суть. Давайте вернемся к примеру с описанием товара.
Что мы хотим? Настроить наш ИИ на написание качественных описаний товаров.
{“prompt”: “Product: Google Ads\nDescription: Google Ads are the best way of advertising
online.\nFinal Output”, “completion”: “Introducing Google Ads. The right and the best way of
advertising your product online on autopilot.”}
{«prompt»: «Продукт: Google Ads\nDescription: Google Ads — лучший способ рекламы
в интернете.\nОкончательный вывод», «complete»: «Представление Google Ads. Правильный и лучший способ
рекламы вашего продукта в Интернете на автопилоте.»}
Вот как это будет выглядеть в подсказке(prompt):
Продукт(Product:):
Напишите краткое описание продукта:
Конечный результат, завершение:
Затем ИИ будет следовать «завершению», данному в процессе обучения, чтобы написать совершенно новое и
высококачественное, связанное с продуктом и описанием продукта, введенным пользователем.
-> что «\n» означает «новая строка», так что, по сути, это помогает ИИ сформировать представление о формате обучения, который мы используем.
формате, который мы используем.
-> Завершение — это идеальный текст, сгенерированный нами для обучения ИИ. Таким образом, вы подаете один пример качественного описания продукта, и ИИ будет следовать шаблону и форматированию для
создания новых.
->Продукт и описание представляют собой именно то, что они означают — обучение ИИ тому, как форматировать это. Сначала мы говорим ему, что нам нужен продукт и описание. Затем пользователь вводит краткое
описание продукта и попадает в «Завершение», которое генерирует высококачественный контент.
Вы можете использовать эту модель форматирования для обучения ИИ буквально на всем. Надеюсь, это было достаточно понятно
достаточно и просто, потому что это лучший способ, который вы можете сделать.
OpenAI говорит: «Для высококачественной сессии тонкой настройки требуется 500 или более завершений».
Это займет ваше время. Но стоит ли оно того? Безусловно, да.
Что остается? Создайте набор данных, используя Visual studio и примеры, которые я вам привел. Затем скармливайте
ему реальные примеры из статей Jasper или Google. Не волнуйтесь, он не будет копировать/вставлять и создавать
плагиат контента. ИИ будет только следовать образцу.
Вы сможете быстро получить собственный инструмент с моделями, обученными на заказ, которые генерируют более качественные и
более быстрые результаты за малую часть стоимости.
Leave a Reply