Machine Learning Engineer в команду SDT Pretrain
Автономная технология
- Москва
- 5-ти дневная рабочая неделя
- Офис
- Офис
Navio — разработчик технологии автономного вождения, совместимой с различными видами транспорта: от легковых автомобилей до грузовиков.
Navio объединяет культуру автопроизводителей и IT-компаний. Каждый день мы работаем над тем, чтобы доставка грузов стала быстрее и эффективнее, а городской транспорт — безопаснее и комфортнее.
Ключевое направление работы Navio — создание универсальной автономной технологии, включающей Software и Hardware компоненты, R&D, уникальный процесс тестирования и экосистему сервисов для обработки данных и управления автономным флотом автомобилей.
О команде:
Мы создаем технологию автономного вождения. У нас накоплены петабайты данных с проездов, которые нужно превратить в полезный датасет для обучения. Твоя задача — не просто сидеть в Jupyter, а построить «фабрику» по автоматической разметке сложных дорожных ситуаций (Scenario Mining) с использованием современных подходов (LLM, VLM, CV) и масштабировать это решение на весь наш архив данных.
Чем предстоит заниматься:
- Разработка методов авторазметки: создание новых и адаптация существующих моделей (в т.ч. VLM и LLM) для семантического поиска событий в проездах (например, «найти все нерегулируемые левые повороты с пешеходами»);
- Пайплайны обработки данных: оборачивание ML-моделей в воспроизводимые пайплайны для массовой обработки исторических и новых данных;
- Работа с данными: организация эффективного чтения/записи результатов в S3, версионирование экспериментов и датасетов через ClearML.
Что мы ждем от кандидата:
- Отличное знание Python, PyTorch, понимание архитектур трансформеров и опыт работы с LLM / VLM (CLIP, LLaVA, GPT-4V API или open-source аналоги). Нам нужно, чтобы модель «понимала» сцену Fine-tuning;
- База по Computer Vision (детектирование, сегментация, трекинг объектов);
- MLOps & Engineering (Важно):
- опыт работы с объектными хранилищами (S3);
- умение писать эффективный код, при котором не падает сеть и сторадж при массовом чтении);
- работа с большим объёмом данных (pandas, numpy, SQL или аналоги);
- умение строить ETL/ELT пайплайны;
- умение работать с SQL, Docker.
- Инструментарий:
- опыт работы с системами трекинга экспериментов (ClearML / MLFlow);
- JupyterHub, как среда для прототипирования.
Будет плюсом++
- Опыт в Autonomous Driving: понимание сенсорики (Lidar, Radar, Camera) и специфики данных (rosbag, pcap и т.д.);
- Data Engineering: опыт работы с Spark для препроцессинга данных, ClickHouse/Metabase для записи и поиска данных, с оркестраторами - Dagster.
Мы заботимся о сотрудниках с первого рабочего дня и предлагаем вам:
Как присоединиться к команде

1
2
3
4