Ошибка!

Показать Ошибка!

Забыли пароль?

Ошибка!

Ошибка!

Скрыть Ошибка!

Скрыть Ошибка!

Забыли пароль? Напишите ваш email и мы отправим письмо с инструкциями.

Ошибка!

Обратно

Закрыть

Стэнфорд создал копию ChatGPT менее чем за 600 долларов

Стэнфорд создал копию ChatGPT менее чем за 600 долларов
Искусственный интеллект Alpaca во многих задачах работает так же, как удивительный ChatGPT, но он построен на модели языка с открытым исходным кодом и стоит менее 600 долларов США для обучения. Кажется, что эти богоподобные ИИ уже пугающе дешевы и их легко воспроизвести.


Полгода назад за развитием больших языковых моделей следили только исследователи и ученые. Но запуск ChatGPT в конце прошлого года ударил по человечеству ракетой: теперь машины могут общаться так же, как люди. Они могут писать тексты и даже программный код в головокружительном множестве предметных областей за считанные секунды, часто на очень высоком уровне. Как показывает запуск GPT-4, они совершенствуются со стремительной скоростью, и они способны коренным образом преобразовать человеческое общество, как мало какие другие технологии, потенциально автоматизируя ряд рабочих задач (особенно среди белых воротничков), что люди ранее считали невозможным.

Многие другие компании, в частности Google, Apple, Meta, Baidu и Amazon, не слишком отстают, и их ИИ скоро наводнят рынок, привязываясь ко всем возможным приложениям и устройствам. Языковые модели уже есть в поисковой системе Bing и скоро появятся в остальных. Они будут в машине, в телефоне, в телевизоре и будут ждать на другом конце линии каждый раз при попытке позвонить в компанию. Вскоре мы увидим их в роботах.

Небольшое утешение заключается в том, что OpenAI и остальные из этих крупных компаний осознают безумный потенциал этих машин для спама, дезинформации, создания вредоносных программ, целенаправленного преследования и всевозможных других вариантов использования, которые, по мнению большинства людей, сделают мир гораздо хуже. Они тратят месяцы и месяцы на то, чтобы вручную ограничить эти возможности перед запуском. Генеральный директор OpenAI Сэм Альтман (Sam Altman) — один из многих, обеспокоенных тем, что правительства действуют недостаточно быстро, чтобы возводить заборы вокруг ИИ во имя общественного блага.

А как насчет языковой модели, которую можно построить самостоятельно за 600 баксов? Группа исследователей из Стэнфорда сделала именно это, и ее впечатляющие результаты показывают, насколько быстро весь этот сектор и его потрясающие возможности могут быстро выйти из-под контроля.

Исследовательская группа из Стэнфорда начала с языковой модели Meta с открытым исходным кодом LLaMA 7B — самой маленькой и дешевой из нескольких доступных моделей LLaMA. Предварительно обученная на триллионе «токенов», эта маленькая языковая модель имела определенные заложенные возможности, но в большинстве задач она значительно отставала от ChatGPT. Дело в том, что основная стоимость и главное конкурентное преимущество моделей GPT в значительной степени связаны с огромным количеством времени и человеческих ресурсов, которые OpenAI вложил в последующее обучение. Одно дело прочитать миллиард книг, и совсем другое — пережевать большое количество пар вопросов и ответов, которые учат этих ИИ тому, в чем будет состоять их настоящая работа.

Когда модель LLaMA 7B была запущена и работала, команда из Стэнфорда попросила GPT взять 175 пар инструкций/выводов, написанных человеком, и начать генерировать больше в том же стиле и формате, по 20 за раз. Это было автоматизировано с помощью одного из услужливо предоставленных API-интерфейсов OpenAI, и за короткое время у команды было около 52 000 примеров разговоров, которые можно было использовать для постобучения модели LLaMA. Генерация этих массовых обучающих данных стоила менее 500 долларов США.

Затем они использовали эти данные для точной настройки модели LLaMA — процесс, который занял около трех часов на восьми компьютерах с облачной обработкой A100 емкостью 80 ГБ. Это стоило менее 100 долларов США.

Затем они протестировали получившуюся модель, которую назвали Alpaca, в сравнении с базовой языковой моделью ChatGPT в различных областях, включая написание электронной почты, социальные сети и инструменты повышения производительности. Alpaca выиграла 90 из этих тестов, GPT — 89.

«Мы были весьма удивлены этим результатом, учитывая небольшой размер модели и скромный объем данных для выполнения инструкций», — пишет команда. «Помимо использования этого набора статических оценок, мы также тестировали модель Alpaca в интерактивном режиме и обнаружили, что Alpaca часто ведет себя аналогично text-davinci-003 [GPT-3.5] на различных наборах входных данных. Мы признаем, что наша оценка может быть ограничена по масштабу и разнообразию».

Далее команда сказала, что они могли бы сделать это дешевле, если бы хотели оптимизировать процесс. Также стоит отметить, что любой, кто хочет воспроизвести ИИ, теперь получил доступ к гораздо более мощному GPT 4.0, а также к нескольким более мощным моделям LLaMA, которые можно использовать в качестве основы, и, конечно же, нет необходимости останавливаться на 52 000 вопросов.


Команда из Стэнфорда опубликовала на Github 52 000 вопросов, использованных в этом исследовании, а также код для создания дополнительных вопросов и код, который они использовали для тонкой настройки модели LLaMA. Команда отмечает, что «мы еще не настроили модель Alpaca, чтобы она была безопасной и безвредной», и просит, чтобы любой, кто устанавливает ее, сообщал о проблемах безопасности и этики, которые обнаружатся.

Так что же может помешать практически любому создать собственный искусственный интеллект сейчас, за сотню баксов или около того, и тренировать по своему усмотрению? В условиях обслуживания OpenAI сказано: «Вы не можете… использовать выходные данные Сервисов для разработки моделей, конкурирующих с OpenAI». И Meta говорит, что на данном этапе разрешает академическим исследователям использовать LLaMA только по некоммерческим лицензиям, хотя это спорный вопрос, поскольку вся модель LLaMA просочилась на 4chan через неделю после ее анонса.

Еще одна группа говорит, что им удалось устранить стоимость облачных вычислений, выпустив на Github больше кода, который может работать на Raspberry Pi, и завершить процесс обучения в течение 5 часов на одной видеокарте nVidia RTX 4090.

Что все это значит? Теперь можно создавать неограниченное количество неконтролируемых языковых моделей — людьми, обладающими знаниями в области машинного обучения, которым наплевать на условия или пиратство программного обеспечения — за гроши.

Это также мутит воду для коммерческих ИИ-компаний, работающих над разработкой собственных языковых моделей; если так много времени и затрат уходит на этап после обучения, и эта работа может быть украдена за время, необходимое для ответа на 50 или 100 000 вопросов, имеет ли смысл компаниям продолжать тратить эти деньги?

А для остальных из нас: трудно сказать, но удивительные возможности этого программного обеспечения, безусловно, могут быть полезны авторитарному режиму, или фишинговым операциям, или спамерам, или любому количеству других изворотливых личностей.

Джинн выпущен из бутылки, и кажется, что его уже невероятно легко воспроизвести и переобучить. Держитесь за шляпы.

Комментарии:

Еще нет комментариев, станьте первым коментатором!
Войдите на зайт или зарегистрируйтесь, чтобы оставлять комментарии!
0
«Кокаиновые бегемоты» стали головной болью для Колумбии

«Кокаиновые бегемоты» стали головной болью для Колумбии

Печально известный наркобарон Пабло Эскобар давно ушел из жизни, но все еще сеет хаос в родной Колумбии благодаря своим процветающим бегемотам.

Еще в 1981 году Эскобар незаконно импортировал одного самца и трех самок гиппопотамов (Hippopotamus amphibius) из зоопарка в США и перевез их на свое частное ранчо в Hacienda Napoles. После его смерти в 1993 году африканские животные были предоставлены сами себе, размножаясь и расселяясь по окрестностям, создавая здоровую популяцию вдоль реки Магдалена. Теперь перепись министерства окружающей сре...
08.06.23 17:09
0
1
Первое обнаружение вторичной сверхмассивной черной дыры в двойной системе

Первое обнаружение вторичной сверхмассивной черной дыры в двойной системе

Сверхмассивные черные дыры, масса которых в несколько миллиардов раз превышает массу Солнца, находятся в центрах активных галактик. Астрономы наблюдают их как яркие галактические ядра, где сверхмассивная черная дыра галактики поглощает материю из аккреционного диска. Часть материи выдавливается в мощный джет. Этот процесс заставляет галактическое ядро ярко светиться во всем электромагнитном спектре.

В недавнем исследовании астрономы обнаружили свидетельства того, что две сверхмассивные черные дыры вращаются друг вокруг друга благодаря сигналам, исходящим от джетов, связанных с аккрецией вещества в обе черные дыры. Галактика, или квазар, как ее технически называют, получила имя OJ287, и она наиболее тщательно изучена и лучше всего понимается как двойная система черных дыр. В небе черные дыры р...
07.06.23 14:03
0
1
Космический телескоп Уэбба обнаружил самые далекие сложные органические молекулы во Вселенной

Космический телескоп Уэбба обнаружил самые далекие сложные органические молекулы во Вселенной

Исследователи обнаружили сложные органические молекулы в галактике, находящейся на расстоянии более 12 миллиардов световых лет от Земли — самой далекой галактике, в которой существуют эти молекулы. Благодаря возможностям космического телескопа Джеймса Уэбба и тщательному анализу, проведенному исследовательской группой, новое исследование дает критическое представление о сложных химических взаимодействиях, которые происходят в первых галактиках ранней Вселенной.

Профессор астрономии и физики Университета Иллинойса Урбана-Шампейн Хоакин Виейра и аспирант Кедар Фадке сотрудничали с исследователями Техасского университета A&M и международной группой ученых, чтобы различить инфракрасные сигналы, генерируемые некоторыми из более массивных и более крупных пылинок в галактике и недавно обнаруженные молекулы углеводородов Результаты исследования опубликованы...
06.06.23 07:53
0
0
Терапия микрочастицами обращает вспять рассеянный склероз у 100% мышей и излечивает одну треть

Терапия микрочастицами обращает вспять рассеянный склероз у 100% мышей и излечивает одну треть

Новое исследование с использованием терапии микрочастицами для увеличения количества «хороших» иммунных клеток обратило вспять повреждение нервных клеток у мышей с симптомами рассеянного склероза и вылечило более трети. Открытие может привести к новым методам лечения не только рассеянного склероза, но и других аутоиммунных заболеваний, таких как диабет 1 типа.

Рассеянный склероз (РС) — неизлечимое аутоиммунное заболевание, вызываемое иммунными клетками организма, которые ошибочно атакуют нервы, передающие информацию в головной и спинной мозг. Болезнь затрагивает почти 3 миллиона человек во всем мире.Эффекторные Т-клетки являются частью первой линии организма против захватчиков. Но при рассеянном склерозе они не понимают, что защитная жировая оболочка (м...
05.06.23 12:26
0
0
Революционная система искусственного интеллекта читает мысли и создает текст без имплантов

Революционная система искусственного интеллекта читает мысли и создает текст без имплантов

Исследователи из Техасского университета в Остине создали систему ИИ для чтения мыслей, которая может считывать изображения активности мозга человека и преобразовывать их в непрерывный поток текста. Система семантического декодера может помочь людям, находящимся в сознании, но не способным говорить, например, перенесшим инсульт.

Новый интерфейс мозг-компьютер отличается от других технологий «чтения мыслей», поскольку его не нужно имплантировать в мозг. Исследователи из Университета Остина сделали неинвазивные записи мозга, используя функциональную магнитно-резонансную томографию (фМРТ), чтобы реконструировать воспринимаемые или воображаемые стимулы с использованием непрерывного естественного языка. ФМРТ дает изображения ...
02.05.23 11:08
1
0
Появились патч-мониторы для растений на наличие болезней и факторов стресса окружающей среды

Появились патч-мониторы для растений на наличие болезней и факторов стресса окружающей среды

Мы можем быть на один шаг ближе к использованию технологии для обеспечения продуктивных, свободных от болезней культур благодаря разработке многофункциональной электронной накладки, «носимой» растениями, и отслеживающей наличие патогенов и факторов стресса окружающей среды.

«Умное» сельское хозяйство, использование инновационных технологий для предоставления информации о таких важных факторах, как вода, типы почвы и болезни, приобрело популярность как средство обеспечения глобальной продовольственной безопасности. Болезни растений приводят к потере от 20% до 40% урожая ежегодно, что не только сокращает производство продуктов питания, но и видовое разнообразие, не го...
13.04.23 09:42
0
6
iPhone 14 и 14 Plus предлагают лучшие камеры, лучшее время автономной работы и технологию SOS

iPhone 14 и 14 Plus предлагают лучшие камеры, лучшее время автономной работы и технологию SOS

7 сентября Apple анонсировала новый iPhone 14 вместе с более крупным 14 Plus. Оба телефона 5G оснащены новой системой камер, функцией обнаружения сбоев, экстренным вызовом SOS через спутник и лучшим временем автономной работы среди всех iPhone.

У базового iPhone 14 6,1-дюймовый дисплей Super Retina XDR, а модель Plus — 6,7 дюйма. Дисплеи оснащены прочным стеклом Ceramic Shield, а также водо- и пыленепроницаемы. Широко разрекламированная система камер включает в себя новые камеры Main, TrueDepth и Ultra wide. У камеры Main большая диафрагма 1,5 и пиксели размером 1,9 микрометра, что позволяет улучшать фото и видео при всех сценариях осв...
11.09.22 10:54
0
1
Дистанционно управляемые тараканы-киборги теперь питаются от Солнца

Дистанционно управляемые тараканы-киборги теперь питаются от Солнца

Зачем создавать роботов с нуля, если природа уже сделала за нас большую часть тяжелой работы? Это причина создания насекомых-киборгов, и теперь ученые нашли способ сделать дистанционно управляемых тараканов-киборгов более совершенными, питая их с помощью специальных солнечных батарей.

Насекомые используют целый ряд мощных органов чувств, они достаточно малы, чтобы добраться до недоступных для нас мест, они могут выживать в неблагоприятных условиях, они могут с легкостью карабкаться по поверхности или летать. Все это полезные атрибуты для роботов — или, что еще лучше, киборгов, если прикрепить электронные устройства к живым насекомым. За прошедшие годы многие виды насекомых под...
06.09.22 08:12
0