С 01.09.2024 вступают в силу изменения подпункта «а» пункта 14 Постановления Правительства Российской Федерации от 18.12.2020 № 2168 «Правила организации и осуществления производственного контроля», в части расширения перечня обязанностей работника, осуществляющего производственный контроль, обязанностью по обеспечению контроля требований промышленной безопасности не только работниками опасных производственных объектов, но и лицами, осуществляющими по гражданско-правовым договорам на опасном производственном объекте работы (оказывающими услуги) в области промышленной безопасности, к которым установлены требования промышленной безопасности. С 1 апреля 2024 года государственная услуга по приему и учету уведомлений о начале осуществления юридическими лицами и индивидуальными предпринимателями деятельности по монтажу, демонтажу, эксплуатации, в том числе обслуживанию и ремонту лифтов, подъемных платформ для инвалидов, пассажирских конвейеров (движущихся пешеходных дорожек), эскалаторов, за исключением эскалаторов в метрополитенах предоставляется посредством ЕПГУ Подача заявительных документов через ЕПГУ по государственной услуге "Регистрация опасных производственных объектов" осуществляется по ссылке: https://www.gosuslugi.ru/623642/1/form Организована работа "Телефона доверия" для приема сообщений по фактам нарушений и произошедших авариях на поднадзорных объектах Енисейского управления Ростехнадзора, тел. 8(391) 252-29-25

ВШЭ и AIRI ускорили дообучение нейросетей

04.06.2025

Метод лучше аналогов справляется с генерацией и анализом изображений, дообучением текстовых моделей. При этом он требует меньше памяти и времени на обучение. Результаты работы были представлены на конференции NeurIPS 2024.

Чем больше нейросеть, тем сложнее быстро подстроить ее под новую задачу. Переобучать модель с нуля — это долго и дорого. Поэтому разработчики ищут бюджетные способы адаптировать ее под конкретную задачу, сохранив при этом общее качество исходной версии.

Один из них — донастройка с помощью ортогональных матриц: в отличие от альтернативных подходов, они сохраняют важные признаки исходной модели. Но у популярных вариантов вроде блочно-диагональных или бабочковых (Butterfly) матриц есть недостатки: они либо ограничены, либо требуют множества вычислений.

Исследователи факультета компьютерных наук НИУ ВШЭ и AIRI предложили новый способ построения матриц, который назвали «Группируй и перемешивай» (Group-and-Shuffle). Вместо того чтобы работать со всеми данными, они делят ее параметры на небольшие группы, обрабатывают каждую отдельно и перемешивают между собой. Такая структура оказалась одновременно гибкой и компактной:  она помогает модели точнее подстраиваться под задачу, но при этом требует меньше вычислений и памяти.

На основе GS-матриц исследователи разработали метод GSOFT — новую реализацию ортогональной донастройки нейросетей. В отличие от предыдущих подходов, GSOFT использует меньше параметров, но сохраняет стабильность и качество обучения даже при малом объеме данных. Команда также предложила двусторонний вариант метода — Double GSOFT, который позволяет изменять параметры сразу с двух сторон, повышая гибкость и точность модели.

Николай Юдин

«Мы придумали, как формировать ортогональные матрицы, используя всего две матрицы специального вида, а не пять-шесть, как в прежних подходах. Это экономит ресурсы и время обучения», — объясняет Николай Юдин, стажер-исследователь Научно-учебной лаборатории матричных и тензорных методов в машинном обучении НИУ ВШЭ.

Исследователи протестировали подход на трех типах задач. В дообучении языковой модели RoBERTa метод работал лучше при сопоставимом числе параметров. В генерации изображений, где модель должна сохранять черты оригинала, но подстраиваться под запрос пользователя, GSOFT и Double GSOFT справились лучше популярных подходов вроде LoRA и BOFT, при этом они требуют меньше памяти и времени на обучение.

Авторы также протестировали свой подход на сверточных нейросетях, которые чаще всего используют для анализа изображений и видео — например, в распознавании лиц. Они адаптировали GS-матрицы даже для тех случаев, когда от модели требуется высокая устойчивость к помехам и искажениям.

«Мы проверили метод в различных сценариях — от языковых и генеративных моделей до устойчивых сверточных сетей. В каждом из них он работал надежно и при меньших затратах ресурсов. Это подтверждает, что мы можем использовать метод для разных целей», — комментирует старший научный сотрудник Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ, руководитель группы “Контролируемый генеративный ИИ” Лаборатории FusionBrain Института AIRI Айбек Аланов.

Источник: hse.ru


Возврат к списку