Autodesk Logo

Autodesk

Senior/Principal Software Engineer, AI/ML Data Systems

Reposted 5 Days Ago
Be an Early Applicant
In-Office
3 Locations
Senior level
In-Office
3 Locations
Senior level
The Senior/Principal Software Engineer will design core data systems for AI/ML, focusing on either data infrastructure or annotation platforms, collaborating with ML engineers and product teams.
The summary above was generated by AI

Job Requisition ID #

25WD90074

25WD90074, Senior/Principal Software Engineer, AI/ML Data Systems

French translation to follow!/Traduction française à suivre!

Position Overview

Join us to design the core data systems powering both traditional machine learning and cutting-edge generative AI/LLM workflows. As a Senior/Principal Software Engineer, you’ll specialize in one of two tracks:

  • Data & Feature Store Infrastructure: Build scalable backend systems for data ingestion, batch/streaming ETL pipelines, feature stores, vector-enabled APIs, and data compliance

  • Labeling & Human Feedback Systems: Design multimodal annotation platforms (text, image, audio, video, 3D), develop RLHF workflows (instruction tuning, output ranking), and drive LLM-assisted labeling innovations

You’ll work closely with ML engineers, MLOps, and product teams to deliver high-impact data and labeling solutions at scale. Reporting to the Head of AI & ML Platform, you’ll turn AI research into production-ready features that create real customer value.

Responsibilities
 Choose one track to focus on:

Data & Feature Store Infrastructure
  • Design and implement scalable feature engineering systems for both batch and streaming computation

  • Build and maintain low-latency online feature serving systems with consistency between training and inference

  • Develop and maintain monitoring systems for feature freshness, data drift, and data quality

  • Integrate feature management solutions with vector databases to support embeddings and retrieval-augmented generation (RAG) workflows

  • Ensure compliance, lineage, and best practices for infrastructure as code


Labeling & Human Feedback Systems
  • Build and scale annotation platforms for diverse data types: text, image, video, audio, and 3D

  • Develop workflows for LLM alignment, including instruction tuning and RLHF (Reinforcement Learning from Human Feedback) output ranking

  • Embed LLM-assisted labeling features such as auto-labeling, policy checking, and active learning

  • Drive annotation quality through processes such as inter-annotator agreement, gold standard samples, and anomaly detection

  • Manage and scale internal/external labeling teams while maintaining secure data integration

Minimum Qualifications

  • 5+ years of experience in data engineering, ML platform, or backend development roles

  • Proficiency in at least one modern programming language (Python preferred)

  • Experience developing and operating distributed backend APIs and SDKs

  • Experience working with cloud platforms (AWS, GCP, or Azure), containers (Docker/Kubernetes), and infrastructure-as-code tools (e.g., Terraform)

Plus, one of the following specialization experiences:

Feature Store Track: (At least have experience with TWO of the following)

  • Hands-on experience with feature store frameworks (e.g., SageMaker Feature Store, Feast, Tecton, Hopsworks), or operating vector database systems for serving LLM use cases

  • Experience with batch and/or streaming data pipelines (e.g., Kafka, Flink, Spark, Ray) and orchestration tools (e.g., Airflow, Argo Workflow)

  • Demonstrated experience at least in one the data areas: data catalog, data validation, versioning, lineage, and security/compliance

Labeling Track: (At least have experience with ONE of the following)
  • Proven working experience with labeling platforms (e.g., GroundTruth, Label Studio)

  • RLHF/instruction tuning, or annotation workflow development

Preferred Qualifications

  • Experience with LLM pipelines, including embeddings, retrieval-augmented generation (RAG), or prompt engineering

  • Familiarity with labeling copilot tools, active learning, or managing hybrid annotation teams

  • Knowledge of knowledge graphs or semantic data modeling

______________________________________________________________________________________________________________

25WD90074, Ingénieur logiciel senior/principal, Systèmes de données IA/ML

Aperçu du poste

Rejoignez-nous pour concevoir les systèmes de données centraux qui alimentent à la fois l'apprentissage automatique traditionnel et les workflows IA/LLM génératifs de pointe. En tant qu'ingénieur logiciel senior/principal, vous vous spécialiserez dans l'un des deux domaines suivants :

  • Infrastructure de stockage des données et des fonctionnalités : vous construirez des systèmes backend évolutifs pour l'ingestion de données, les pipelines ETL par lots/en continu, les magasins de fonctionnalités, les API compatibles avec les vecteurs et la conformité des données
  • Systèmes d'étiquetage et de feedback humain : vous concevrez des plateformes d'annotation multimodales (texte, image, audio, vidéo, 3D), développerez des workflows RLHF (ajustement des instructions, classement des résultats) et piloterez des innovations en matière d'étiquetage assisté par LLM

Vous travaillerez en étroite collaboration avec les ingénieurs ML, les MLOps et les équipes produit afin de fournir des solutions de données et d'étiquetage à fort impact et à grande échelle. Sous la responsabilité du responsable de la plateforme IA et ML, vous transformerez la recherche en IA en fonctionnalités prêtes à être mises en production et créant une réelle valeur ajoutée pour les clients.

Responsabilités

Choisissez un domaine dans lequel vous souhaitez vous spécialiser:

Infrastructure de stockage des données et des fonctionnalités
  • Concevoir et mettre en œuvre des systèmes d'ingénierie des fonctionnalités évolutifs pour le calcul par lots et en continu
  • Construire et maintenir des systèmes de service de fonctionnalités en ligne à faible latence, avec une cohérence entre l'entraînement et l'inférence
  • Développer et maintenir des systèmes de surveillance pour la fraîcheur des fonctionnalités, la dérive des données et la qualité des données
  • Intégrer des solutions de gestion des fonctionnalités avec des bases de données vectorielles pour prendre en charge les workflows d'intégration et de génération augmentée par la récupération (RAG)
  • Garantir la conformité, la traçabilité et les meilleures pratiques pour l'infrastructure en tant que code
Systèmes d'étiquetage et de feedback humain:
  • Construire et faire évoluer des plateformes d'annotation pour divers types de données : texte, image, vidéo, audio et 3D
  • Développer des workflows pour l'alignement LLM, y compris le réglage des instructions et le classement des résultats RLHF (apprentissage par renforcement à partir du feedback humain)
  • Intégrer des fonctionnalités d'étiquetage assisté par LLM telles que l'étiquetage automatique, la vérification des politiques et l'apprentissage actif
  • Améliorez la qualité des annotations grâce à des processus tels que la concordance entre annotateurs, les échantillons de référence et la détection des anomalies
  • Gérez et faites évoluer les équipes d'étiquetage internes/externes tout en maintenant une intégration sécurisée des données

Qualifications minimales

  • Au moins 5 ans d'expérience dans l'ingénierie des données, les plateformes ML ou le développement backend
  • Maîtrise d'au moins un langage de programmation moderne (Python préféré).
  • Expérience dans le développement et l'exploitation d'API et de SDK backend distribués
  • Expérience de travail avec des plateformes cloud (AWS, GCP ou Azure), des conteneurs (Docker/Kubernetes) et des outils d'infrastructure en tant que code (par exemple, Terraform)

De plus, l'une des expériences de spécialisation suivantes:

Feature Store Track: (Au moins DEUX des éléments suivants)

  • Expérience pratique des frameworks de magasins de fonctionnalités (par exemple, SageMaker Feature Store, Feast, Tecton, Hopsworks) ou de l'exploitation de systèmes de bases de données vectorielles pour des cas d'utilisation LLM
  • Expérience des pipelines de données par lots et/ou en streaming (par exemple, Kafka, Flink, Spark, Ray) et des outils d'orchestration (par exemple, Airflow, Argo Workflow)
  • Expérience avérée dans au moins un des domaines suivants : catalogue de données, validation des données, gestion des versions, lignage et sécurité/conformité
Labeling Track: (Au moins une expérience dans l'un des domaines suivants)
  • Expérience professionnelle avérée avec des plateformes de labellisation (par exemple, GroundTruth, Label Studio)
  • RLHF/réglage des instructions ou développement de workflows d'annotation

Qualifications souhaitées

  • Expérience avec les pipelines LLM, y compris les intégrations, la génération augmentée par la récupération (RAG) ou l'ingénierie de prompts
  • Connaissance des outils de copilotage de l'étiquetage, de l'apprentissage actif ou de la gestion d'équipes d'annotation hybrides
  • Connaissance des graphes de connaissances ou de la modélisation sémantique des données

Learn More / Plus d'information

About Autodesk / À propos d’Autodesk

Welcome to Autodesk! Amazing things are created every day with our software – from the greenest buildings and cleanest cars to the smartest factories and biggest hit movies. We help innovators turn their ideas into reality, transforming not only how things are made, but what can be made.

We take great pride in our culture here at Autodesk – it’s at the core of everything we do. Our culture guides the way we work and treat each other, informs how we connect with customers and partners, and defines how we show up in the world.

When you’re an Autodesker, you can do meaningful work that helps build a better world designed and made for all. Ready to shape the world and your future? Join us!

Bienvenue chez Autodesk ! Nos logiciels créent chaque jour des choses extraordinaires : des bâtiments les plus écologiques aux voitures les plus propres, en passant par les usines les plus intelligentes et les films à succès. Nous aidons les innovateurs à concrétiser leurs idées, transformant non seulement la façon dont les choses sont fabriquées, mais aussi ce qui peut l’être. Nous sommes très fiers de notre culture chez Autodesk ; elle est au cœur de tout ce que nous faisons. Notre culture guide notre façon de travailler et de nous comporter les uns envers les autres, influence nos interactions avec nos clients et nos partenaires, et définit notre image au monde. En tant qu’Autodeskien, vous pouvez accomplir un travail significatif qui contribue à bâtir un monde meilleur, conçu et réalisé pour tous. Prêt à façonner le monde et votre avenir ? Rejoignez-nous !

Salary transparency / Transparence salariale

Salary is one part of Autodesk’s competitive compensation package. Offers are based on the candidate’s experience and geographic location. In addition to base salaries, our compensation package may include annual cash bonuses, commissions for sales roles, stock grants, and a comprehensive benefits package.

Le salaire est l'un des éléments du programme de rémunération concurrentiel d'Autodesk. Pour les postes basés au Canada (Colombie-Britannique), nous proposons un salaire de base compris entre X et X dollars. Les offres sont basées sur l'expérience et la situation géographique du candidat et peuvent dépasser cette fourchette. En plus du salaire de base, notre programme de rémunération peut inclure des primes annuelles en espèces, des commissions pour les postes commerciaux, des attributions d'actions et un ensemble complet d'avantages sociaux.

Diversity & Belonging / Diversité et appurtenance

We take pride in cultivating a culture of belonging where everyone can thrive. Learn more here: https://www.autodesk.com/company/diversity-and-belonging

Nous sommes fiers de cultiver une culture d’appartenance où chacun peut s’épanouir. Pour en savoir plus, cliquez ici : https://www.autodesk.com/company/diversity-and-belonging

Are you an existing contractor or consultant with Autodesk?

Êtes-vous un sous-traitant ou un consultant existant d’Autodesk ?

Please search for open jobs and apply internally (not on this external site).

Veuillez rechercher des emplois vacants et postuler à l’interne (pas sur ce site externe).

Top Skills

Airflow
Argo Workflow
AWS
Azure
Docker
Feast
Flink
GCP
Groundtruth
Hopsworks
Kafka
Kubernetes
Label Studio
Python
Ray
Sagemaker Feature Store
Spark
Tecton
Terraform

Similar Jobs

An Hour Ago
Hybrid
2 Locations
Entry level
Entry level
Fintech • Financial Services
The analyst will support low complexity tasks in Secured Lending Underwriting, review policies, provide information to stakeholders, and develop understanding of compliance requirements.
Top Skills: ExcelMs Office (WordPowerpoint)
An Hour Ago
Hybrid
2 Locations
Mid level
Mid level
Fintech • Financial Services
The Bilingual Business Lending Relationship Specialist will manage client relationships, analyze client portfolios, and resolve lending situations. This role requires building relationships with clients and providing credit solutions while evaluating financial risks.
An Hour Ago
Hybrid
2 Locations
Senior level
Senior level
Fintech • Financial Services
Lead strategic market planning and business development in Commercial Banking by analyzing complex prospects and collaborating with internal teams to drive new client relationships and profitability.

What you need to know about the Los Angeles Tech Scene

Los Angeles is a global leader in entertainment, so it’s no surprise that many of the biggest players in streaming, digital media and game development call the city home. But the city boasts plenty of non-entertainment innovation as well, with tech companies spanning verticals like AI, fintech, e-commerce and biotech. With major universities like Caltech, UCLA, USC and the nearby UC Irvine, the city has a steady supply of top-flight tech and engineering talent — not counting the graduates flocking to Los Angeles from across the world to enjoy its beaches, culture and year-round temperate climate.

Key Facts About Los Angeles Tech

  • Number of Tech Workers: 375,800; 5.5% of overall workforce (2024 CompTIA survey)
  • Major Tech Employers: Snap, Netflix, SpaceX, Disney, Google
  • Key Industries: Artificial intelligence, adtech, media, software, game development
  • Funding Landscape: $11.6 billion in venture capital funding in 2024 (Pitchbook)
  • Notable Investors: Strong Ventures, Fifth Wall, Upfront Ventures, Mucker Capital, Kittyhawk Ventures
  • Research Centers and Universities: California Institute of Technology, UCLA, University of Southern California, UC Irvine, Pepperdine, California Institute for Immunology and Immunotherapy, Center for Quantum Science and Engineering

Sign up now Access later

Create Free Account

Please log in or sign up to report this job.

Create Free Account