Data Scientist в команду SDT Pretrain
Автономная технология
- Москва
- Продолжительность рабочего дня может меняться
- Гибкий график
- Офис
Navio — разработчик технологии автономного вождения, совместимой с различными видами транспорта: от легковых автомобилей до грузовиков.
Navio объединяет культуру автопроизводителей и IT-компаний. Каждый день мы работаем над тем, чтобы доставка грузов стала быстрее и эффективнее, а городской транспорт — безопаснее и комфортнее.
Ключевое направление работы Navio — создание универсальной автономной технологии, включающей Software и Hardware компоненты, R&D, уникальный процесс тестирования и экосистему сервисов для обработки данных и управления автономным флотом автомобилей.
О команде:
Мы создаем технологии автономного вождения. У нас накоплены петабайты данных с проездов, которые нужно превратить в полезный датасет для обучения. Твоя задача — не просто сидеть в Jupyter, а провести анализ и реализовать пайплайны для тегирования сложных дорожных ситуаций.
Чем предстоит заниматься:
- Разработка пайплайнов и эвристик: разработка пайплайнов с использованием методов математической статистики, ML/DL, CV, LLM/VLM и программирования (Python, SQL) для тегирования данных;
- Пайплайны обработки данных: оборачивание разработанных алгоритмов обработки в воспроизводимые пайплайны для массовой обработки исторических и новых данных (Dagster);
- Работа с данными: организация эффективного чтения/записи результатов в S3, версионирование экспериментов и датасетов через ClearML.
Что мы ждем от кандидата:
- Python & ML Core & CV:
- отличное знание Python, PyTorch;
- база по Computer Vision (детектирование, сегментация, трекинг объектов).
- Работа с данными:
- опыт обработки больших объёмов данных: pandas, numpy, Scikit-learn, XGBoost, SQL или аналоги;
- опыт использования библиотек визуализации (Matplotlib, Seaborn);
- умение работать с Docker.
- Инструментарий:
- опыт работы с системами трекинга экспериментов (ClearML / MLFlow);
- опыт работы с оркестраторами: Dagster;
- JupyterHub, как среда для прототипирования.
Будет плюсом:
- ML: Понимание архитектур трансформеров и опыт работы с LLM / VLM (CLIP, LLaVA, GPT-4V API или open-source аналоги);
- Опыт в Autonomous Driving: Понимание сенсорики (Lidar, Radar, Camera) и специфики данных (rosbag, pcap и т.д.);
- Data Engineering: Опыт работы с Spark для препроцессинга данных, ClickHouse/Metabase для поиска и записи данных.
Мы заботимся о сотрудниках с первого рабочего дня и предлагаем вам:
Как присоединиться к команде

1
2
3
4