News - Integra

Siam ML Hack: интервью с экспертом о вызовах, перспективах и возможностях

Компания «СИАМ» объявила о запуске хакатона Siam ML Hack, который посвящён применению машинного обучения в нефтегазовой отрасли. Мероприятие пройдет с 28 февраля по 19 марта и станет площадкой для разработчиков, аналитиков и специалистов по машинному обучению, желающих предложить инновационные решения для реальных задач отрасли.

Задачи хакатона относятся к среднему уровню сложности, поэтому специалисты разной степени подготовки могут попробовать свои силы при выполнении заданий. Кроме того, начальник отдела автоматизации компании «СИАМ» Исупов Сергей Вадимович поделился нюансами предстоящего события.

О компании и технологиях

– Компания «СИАМ» работает в нефтесервисе с 1990 года. Как за это время изменились подходы к анализу данных, и какие технологии сейчас наиболее востребованы?
За прошедшие десятилетия методы сбора и анализа данных в нефтесервисе претерпели колоссальные изменения. Если до 1990-х годов на месторождениях использовались в основном механические приборы, которые писали показания на бумагу (по принципу, схожему с кардиограммами в больницах), то анализ таких данных приходилось проводить вручную — с помощью линейки, циркуля и других «античных» инструментов. Эти бумажные ленты складывали, обрабатывали и лишь затем делали выводы.
С развитием цифровых технологий появилась возможность сохранять данные в электронном виде, загружать их в базы и автоматизировать часть расчетов. Собственно, с этого этапа начала свою деятельность и наша компания: мы начали разрабатывать приборы, заменяющие устаревшие механические устройства, и предлагать первые программные инструменты для аналитики.
Позднее, по мере роста вычислительных мощностей и увеличения объёмов доступных данных, стали набирать популярность сложные численные методы анализа. Сегодня мы внедряем инструменты на базе искусственного интеллекта, которые фактически развивают идеи прежних аналитических и численных подходов, но работают автономнее и позволяют обрабатывать большие потоки информации без постоянного ручного контроля со стороны инженеров.
– Как машинное обучение применяется в гидродинамических исследованиях? С какими типами данных вы работаете?

Мы используем разные архитектуры нейронных сетей: полносвязные (Fully Connected), сверточные (Convolutional) и рекуррентные (Recurrent). Каждая из них решает свои «атомарные» задачи, а затем все вместе объединяются в комплексные системы для выполнения более сложных интеллектуальных инженерных задач. Основные типы данных, с которыми мы работаем:

• Временные ряды: непрерывные измерения параметров со скважин.

• Графические данные: изображения графиков, которые могут содержать визуальные паттерны.

• Табличная априорная информация: справочные сведения, различные параметры объектов и т.д.

В последнее время мы активно изучаем большие языковые модели (LLM) и разрабатываем на их основе специализированных агентов, которые помогают автоматизировать рутинные задачи в аналитике и обработке данных.

Исупов Сергей Вадимович, начальник отдела автоматизации компании «СИАМ»

О внутренних процессах компании

– Как вы видите развитие машинного обучения в нефтесервисе? Какие задачи в будущем можно будет автоматизировать?

Тренды примерно те же, что и в других отраслях: любая рутинная и не слишком «высокоинтеллектуальная» работа постепенно будет автоматизирована при помощи ИИ. Прежде всего, это сбор, классификация, предобработка данных, а также простейшие интерпретации.

Мы видим, что большие языковые модели (LLM) и интеллектуальные агенты могут найти применение не только в аналитике, но и, например, в диспетчеризации и логистике. При идеальном сценарии люди продолжат решать стратегические и тяжелые научные (rocket science) задачи, а повседневный «оператив» возьмёт на себя искусственный интеллект. Разумеется, путь к этому довольно долгий и трудоёмкий, но те, кто первыми добьются результата, получат значительное конкурентное преимущество.

– Как выстраиваются отношения между IT-отделами и другими сотрудниками компании?

У нас налажена дружеская и при этом продуктивная атмосфера. Формальные процессы, такие как сбор требований и фиксация задач, идут через стандартные инструменты — баг-трекеры, таск-трекеры и т.д. Однако мы не ограничиваемся строгими регламентами: если появляется срочная проблема или новое интересное решение, сотрудники могут напрямую взаимодействовать с разработчиками или инженерами.

Часто возникают ситуации, когда кто-то из пользователей просит «быстро поправить» функционал, либо наоборот разработчик просит «протестировать» новую фичу на реальных данных. Иногда такие «пробы пера» вырастают в полноценный продукт. Мы стараемся сохранять баланс между формальной структурой и живым творческим процессом.

О перспективах для участников

– Будут ли финальные решения хакатона использоваться в работе компании? Возможно ли дальнейшее сотрудничество с участниками?

Если хакатон принесёт результат, который превосходит наши внутренние наработки, мы немедленно возьмём его в работу. Сейчас мы находимся в фазе активной разработки и можем достаточно быстро интегрировать новое решение в наши продукты, разумеется, после необходимой обкатки и тестирования.

Что касается сотрудничества, то это одна из главных причин, по которым мы решили провести хакатон. Нам нужны специалисты, и если мы увидим сильные команды или отдельных участников, мы будем рады предложить им сотрудничество или даже постоянное место в компании.

– Есть ли перспективы для участников в компании? Например, на hh.ru нет вакансий для разработчиков. Планирует ли «СИАМ» привлекать IT-специалистов?

Мы не особо полагаемся на hh.ru, поскольку наш опыт показывает, что найти профильных и мотивированных сотрудников там бывает непросто. Поэтому сейчас пробуем альтернативные способы привлечения специалистов — хакатон является одним из них. Нам действительно нужны IT-кадры, и мы всегда открыты для предложений от потенциально подходящих кандидатов.

– Какие навыки нужны IT-специалистам, чтобы работать в нефтесервисной отрасли? Что важно помимо машинного обучения?

Мы ищем инженеров, которые умеют эффективно решать задачи и создавать работоспособные продукты. Формальные «прокачанные» знания — это хорошо, но нам куда важнее практический склад ума и способность доводить проект до результата.

Мы не гонимся за «рок-звёздами» или специалистами, которые жаждут осваивать все новые технологии ради самих технологий. Для нас приоритет — надёжность, инженерное мышление и желание разбираться в специфике нефтесервиса.

Если мы видим, что человек «горит» задачей, умеет держаться и показывать реальные результаты, — это наш потенциальный сотрудник.

– Возможна ли удаленная работа для IT-специалистов в вашей компании?

Да, мы давно перешли к распределённой модели: сотрудники отдела разработки сейчас находятся минимум в четырёх разных городах. Удалённая форма работы показала себя эффективной, поэтому мы спокойно относимся к географической разбросанности команды.

О задачах хакатона

– Какие реальные бизнес-задачи стоят за треками хакатона? Можно ли сказать, что они приближены к кейсам, с которыми сталкиваются специалисты «СИАМ»?

Задачи хакатона — это не отвлечённые упражнения, а самые настоящие бизнес-кейсы, с которыми наши инженеры сталкиваются в повседневной работе. К примеру, трек по определению бинарных признаков помогает дополнить сложные алгоритмы интерпретации и улучшить точность итоговых моделей.

Другая задача — определение областей полезных данных в непрерывном потоке замеров со скважин. Важно автоматически понимать, какие временные интервалы или сегменты заслуживают дальнейшего анализа, а какие можно отсеять как нерелевантные. Если упростить: первая задача помогает интерпретировать данные, вторая — решает вопрос, какие данные вообще нужно интерпретировать.

– Почему были выбраны именно эти треки? Они рассчитаны на инновации, новые решения или привлечение новых сотрудников в компанию?

У нас две цели, связанные с этими задачами:

Улучшение или поиск альтернативных решений:

• Одна из задач у нас уже решена, но мы хотим посмотреть, нет ли более оптимального или «свежего» подхода. Всегда полезно увидеть, как другие специалисты, незашоренные контекстом, подходят к задаче.

• Вторая задача пока не имела готовой реализации внутри компании, поэтому мы надеемся получить либо прототип, либо полноценное решение.

Расширение команды:

• Хакатон — это отличная возможность найти людей, которым интересен наш профиль. У нас очень много идей и проектов, и нам постоянно нужны новые разработчики.

– На какой уровень рассчитаны задачи хакатона? Кто является целевой аудиторией мероприятия?

По своей природе это скорее задачи среднего уровня, возможно дажеё ближе к начальному. Ключевые операции — это классификация, регрессия и базовая работа с данными. Однако их актуальность и ценность от этого не становятся меньше: именно такие «типовые» задачи составляют значительную часть реальной практики машинного обучения в нефтесервисе.

программный комплекс Siam Well Test

О хакатоне и успешных проектах

– Что привело к решению провести хакатон? Это ведь первое подобное мероприятие для компании.

Да, это действительно наш первый опыт в проведении подобных мероприятий. Идея пришла после того, как мы начали активно набирать молодёжь, у которой был опыт участия в хакатонах. Они рассказали, насколько это эффективный формат для поиска инноваций, прокачки компетенций и нетворкинга. Мы видим для себя несколько целей:

1. Повышение узнаваемости компании в информационном пространстве.

2. Получение реальных решений для реальных кейсов.

3. Привлечение новых сотрудников — у нас много планов и проектов, и мы хотим найти людей, готовых ими заниматься.

– Расскажите о наиболее успешных проектах, которые были реализованы совместно с IT-специалистами в компании «СИАМ». Какие результаты они принесли и как повлияли на развитие компании?

SiamWellTest

Это наш основной продукт для интерпретации гидродинамических и газодинамических исследований. Фактически он замещает собой импортные аналоги и закрывает большинство потребностей в данной области. Мы успешно продвигаем этот продукт на российском рынке (хотя это весьма узкая ниша), и мы активно развиваем его в направлении автоматизации анализа с помощью моделей ИИ.

SiamEngy

Мобильное приложение, ориентированное на более широкую аудиторию — от начинающих нефтяников и студентов до практикующих инженеров. Оно предоставляет справочные данные и функционал, упрощающий повседневную работу. На сегодняшний день им пользуются порядка 15 тысяч человек (на обеих платформах – Andoid, iOS). Для своей ниши это очень хороший показатель, а само приложение распространяется бесплатно. Мы не нашли на рынке аналогов, сопоставимых с ним по качеству и содержанию.

SiamDataSpectrum

Новый программный комплекс для системного хранения больших массивов данных, поступающих с датчиков. В нефтесервисе такие данные представляют собой непрерывные высокодискретные потоки. Это могут быть терабайты информации в месяц, которые нужно не только хранить, но и уметь быстро индексировать и сегментировать, получать доступ к нужным интервалам «по щелчку». Сейчас продукт находится в стадии бета-тестирования внутри компании, и мы готовим его к выводу на рынок.

Как попасть на хакатон

Регистрация на хакатон открыта до 27 февраля на сайте: https://codenrock.com/contests/siam-ml-hack/
Митап хакатона Siam ML Hack успешно состоялся 21 февраля в 19:00 по московскому времени. Во время трансляции организаторы подробно рассказали о задачах хакатона и ключевых организационных моментах. Если вы пропустили мероприятие, рекомендуем ознакомиться с записью!
Сам хакатон Siam ML Hack пройдёт с 28 февраля по 19 марта. Победители получат ценные призы от партнёров и возможность сотрудничества с одной из ведущих компаний нефтесервисной отрасли.