Компания Anthropic представила Claude 2 – большую языковую модель (LLM), похожую на ChatGPT, которая способна генерировать код, анализировать текст и файлы.
В отличие от первоначальной версии Claude, выпущенной в марте, пользователи теперь могут бесплатно попробовать Claude 2, но только если они проживают в Великобритании или США. Также нейронная сеть доступна в виде коммерческого API для разработчиков.
Anthropic заявляет, что Claude разработан для имитации разговора с услужливым коллегой или личным помощником, и новая версия учитывает отзывы пользователей предыдущей модели:
“Мы слышали от наших пользователей, что легко общаться с Claude, так как он четко объясняет свои мысли, реже дает вредные результаты и имеет большую память”, – заявили в Anthropic.
Также там утверждают, что Claude 2 достиг значительных результатов в трех основных областях: кодировании, математике и рассуждениях.
“Наша последняя модель набрала 76,5% баллов в разделе множественного выбора на экзамене Bar, по сравнению с 73,0% у Claude 1.3, – написали разработчики. – По сравнению со студентами, поступающими в аспирантуру, Claude 2 набрал более 90-го процентиля на экзаменах GRE по чтению и письму, а также аналогичный процентиль по количественному мышлению”.
Одним из основных улучшений Claude 2 является увеличение длины ввода и вывода. Anthropic экспериментирует с обработкой подсказок длиной до 100 000 токенов (фрагментов слов), что позволяет искусственному интеллекту анализировать длинные документы, такие как технические руководства или целые книги. Увеличенный объем также распространяется на выходные данные, что позволяет создавать более длинные документы.
Основной целью Anthropic было сделать так, чтобы языковая модель меньше генерировала “вредные” или “оскорбительные” результаты при определенных запросах, хотя измерение этих характеристик является крайне субъективным и сложным. Согласно внутренней оценке разработчиков, Claude 2 дважды чаще предоставлял безопасные ответы по сравнению с Claude 1.3.