Модели встраивания
OpenAI предлагает одну модель встраивания второго поколения (обозначается -002 в ID модели) и 16 моделей первого поколения (обозначается -001 в ID модели).
Мы рекомендуем использовать text-embedding-ada-002 почти для всех случаев использования. Она лучше, дешевле и проще в использовании.
MODEL GENERATION | TOKENIZER | MAX INPUT TOKENS | KNOWLEDGE CUTOFF |
---|---|---|---|
V2 | cl100k_base | 8191 | Сентябрь 2021 |
V1 | GPT-2/GPT-3 | 2046 | Август 2020 |
Стоимость использования определяется по цене за токен, по курсу $0,0004 за 1000 токенов, или около ~3,000 страниц за доллар США (при условии ~800 токенов на страницу):
МОДЕЛЬ | ПРИМЕР ПРОИЗВОДИТЕЛЬНОСТИ НА ДОЛЛАР | ПО ОЦЕНКЕ ПОИСКА БИРА |
---|---|---|
text-embedding-ada-002 | 3000 | 53.9 |
*-davinci-*-001 | 6 | 52.8 |
*-curie-*-001 | 60 | 50.9 |
*-babbage-*-001 | 240 | 50.4 |
*-ada-*-001 | 300 | 49.0 |
GPT-3
Модели GPT-3 могут понимать и генерировать естественный язык. Эти модели были заменены более мощными моделями поколения GPT-3.5. Однако оригинальные базовые модели GPT-3 (davinci, curie, ada и babbage) в настоящее время являются единственными моделями, доступными для тонкой настройки.
Какую модель (model id) выбрать для openai
МОДЕЛЬ | ОПИСАНИЕ | MAX ТОКЕНОВ | TRAINING DATA |
---|---|---|---|
text-curie-001 | Очень способный, более быстрый и недорогой, чем Davinci. | 2,049 tokens | Up to Oct 2019 |
text-babbage-001 | Способен выполнять простые задачи, очень быстрый и недорогой. | 2,049 tokens | Up to Oct 2019 |
text-ada-001 | Способен выполнять очень простые задачи, обычно является самой быстрой моделью в серии GPT-3 и имеет самую низкую стоимость. | 2,049 tokens | Up to Oct 2019 |
davinci | Самая функциональная модель GPT-3. Может выполнять любые задачи, которые могут выполнять другие модели, часто с более высоким качеством. | 2,049 tokens | Up to Oct 2019 |
curie | Очень способный, но более быстрый и дешевый, чем Davinci. | 2,049 tokens | Up to Oct 2019 |
babbage | Способен выполнять простые задачи, очень быстрый и недорогой. | 2,049 tokens | Up to Oct 2019 |
ada | Способен выполнять очень простые задачи, обычно является самой быстрой моделью в серии GPT-3 и имеет самую низкую стоимость. | 2,049 tokens | Up to Oct 2019 |
Совместимость с конечными точками модели
КОНЕЧНАЯ ТОЧКА | ИМЯ МОДЕЛИ | |
---|---|---|
/v1/chat/completions | gpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301 | |
/v1/completions | text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001, davinci, curie, babbage, ada | |
/v1/edits text-davinci-edit-001 | text-davinci-edit-001, code-davinci-edit-001 | |
/v1/audio/transcriptions | whisper-1 | |
/v1/audio/translations | whisper-1 | |
/v1/fine-tunes | davinci, curie, babbage, ada | |
/v1/embeddings | text-embedding-ada-002, text-search-ada-doc-001 | |
/v1/moderations | text-moderation-stable, text-moderation-latest |
Постоянное обновление моделей
С выходом gpt-3.5-turbo некоторые из наших моделей теперь постоянно обновляются. Чтобы уменьшить вероятность того, что изменения в модели неожиданно повлияют на наших пользователей, мы также предлагаем версии моделей, которые остаются статичными в течение 3 месяцев. С новой периодичностью обновлений моделей мы также предоставляем людям возможность вносить оценки, чтобы помочь нам улучшить модель для различных случаев использования. Если вам интересно, загляните в репозиторий OpenAI Evals.
Следующие модели — это временные снимки, которые будут устаревшими в указанную дату. Если вы хотите использовать последнюю версию модели, используйте стандартные имена моделей, например gpt-4 или gpt-3.5-turbo.
ИМЯ МОДЕЛИ | ДАТА СПИСАНИЯ | |
---|---|---|
gpt-3.5-turbo-0301 | 1 ИЮНЯ, 2023 | |
gpt-4-0314 | 14 ИЮНЯ, 2023 | |
gpt-4-32k-0314 | 14 ИЮНЯ, 2023 |
Узнать более подробно про файн тюнинг Open AI можно в нашей статье.
Leave a Reply