チューリング の技術ブログ

[Tips] NGC PyTorchのversion lockを解除する方法

はじめに Turingの基盤AIチームに業務委託として所属している東京科学大学(Institute of Science Tokyo)の藤井です。本記事では、NVIDIA NGC PyTorchのcontainerを利用する際に直面するversion lock問題に関する知見や注意点について紹介します。 普段はSwallow Projectや横田研究室にて大規模モデルの分散並列学習や低精度学習について研究を行っていますので、そちらもご覧いただけますと幸

「言葉」で守る自動運転の安全と倫理 –マルチモーダル時代のアラインメント戦略

はじめに チューリングの髙橋です。機械学習やAIにおけるセキュリティやプライバシーの研究開発を専門としています。 チューリングでは、「完全自動運転」の実現を見据えて、LLMに視覚理解や行動計画を統合したマルチモーダルAIの研究開発に取り組んでいます。このようなモダリティの統合に加えて、ひとの価値観と整合(アライン)したふるまいも、安全な自動運

[Tips] PyTorchにおける動的リンク

はじめに Turingの基盤AIチームに業務委託として所属している東京科学大学(Institute of Science Tokyo)の藤井です。 本記事では、PyTorchをsource buildした後に利用する際にCUDA Toolkitをmodule loadしておく必要があることの背景について解説を行います。 また、pip installによりbuild済みのbinaryをインストールしたときのPyTorchとsource buildした場合の違いについても解説を行います。 普段はSw

[Tips] LFTPによるデータ転送

はじめに Turingの基盤AIチームに業務委託として所属している東京科学大学(Institute of Science Tokyo)の藤井です。 本記事では、LLM(Large Language Models)やVLM(Vision Language Models)などの学習で利用するデータセットを複数のデータセンター間で並列転送する際に利用しているLFTPの使用方法について紹介します。AWS S3, GCSなどのCloud Service企業のストレージサービスを利用される場合は、aws

Webスケールの日本語-画像のインターリーブデータセット「MOMIJI」の構築 /巨大テキストデータをAWSで高速に処理するパイプライン

はじめに チューリング基盤AIチームの @stu3dio_graph です。 チューリングでは視覚と言語を統合的に理解できるAIを自動運転に応用するため,LLMを視覚モーダルに拡張したVision-Language モデル(VLM)「Heron」の開発に取り組んでいます。 チューリングは経済産業省およびNEDOが推進する日本の生成AIの開発力強化に向けたプロジェクト GENIAC第2期 に採択されました。GENIACでは,完

軽量な視覚言語モデル「Heron」のiOSアプリを公開しました

完全自動運転の実現を目指すTuringでは、Webスケールのデータセットで学習した大規模視覚言語モデル(VLM)の持つ「常識」を利用することで、幅広い状況に対応できる自動運転モデルの開発を実現できると考えています。 この目標のもと、基盤AIチームでは2023年から視覚言語モデル「Heron」の開発に取り組んできました。 https://www.watch.impress.co.jp/docs/news/1529946.html VLMを自動

日本語VLM「Heron-NVILA」公開 ─ Qwen2.5-VL-7B・Gemma3-12Bに匹敵する性能

はじめに チューリングの横井です。チューリングでは視覚と言語を統合的に理解できるAIを自動運転に応用するため、Vision Language モデル(VLM)「Heron」の開発に取り組んでいます。このたび、経済産業省およびNEDOが推進する日本の生成AIの開発力強化に向けたプロジェクト「GENIAC」第2期の支援のもと開発したVLM「Heron-NVILA」15B, 2B, 1B, 33Bを公開しました。 https://huggingface.co/t

自動運転データセットへのWebDatasetのIndexed Datasetの導入

はじめに こんにちは。Turing MLOpsチームの塚本です。 自動運転AIの性能を高めるには、モデルの改良だけでなくデータの量と質が何より重要です。Turingでは「データセントリックAI」の考え方のもと、1日あたり20TBを超える膨大なセンサーデータを活用し、大容量、高品質かつ多様性のある学習データセットの構築に取り組んでいます。 https://zenn.dev/turing_motors/articles/045fedc150
AWS

ABCI 生成AIハッカソンで日本語VLMを作成しました

はじめに 本記事ではABCI ハッカソンで実施した日本語 VLM(Vision-Language Model)作成の取り組みについて紹介します。ABCI 3.0を活用したVLMの学習に関する内容であり、以下の読者を想定しています。 ABCI ハッカソンの概要を知りたい方 ABCI 3.0でVLMの学習がどの程度高速化できたか知りたい方 ABCI 生成AIハッカソン ABCI 生成AIハッカソンは2025年2月4日から2月13日にかけて開催され

可変品質での圧縮を実現する画像トークナイザ「One-D-Piece」を公開しました

Turingの基盤AIチームの三輪です。 Turingで研究・開発した結果をまとめた「One-D-Piece: Image Tokenizer Meets Quality-Controllable Compression」という論文を公開したので、紹介します。 https://turingmotors.github.io/one-d-piece-tokenizer/ https://arxiv.org/abs/2501.10064 これは何? 「One-D-Piece」という新たな「画像トークナイザ」を提案しました。これによって256段階の可変品質で画像を圧縮し、Transforme

TypeScriptで作る自動運転UI

こんにちは!チューリングでソフトウェアエンジニアをしている太田です。 自動運転システムの開発を手がけるチューリングでは、大規模な GPU クラスタでトレーニングされたモデルが日々リリースされ、実車環境でのテストが行われています。 自動運転と聞くと、ハードウェア寄りの技術を連想するかもしれませんが、チューリングの自動運転開発においてWeb系の技術

オープンソースのロギング・可視化ツールRerunを使ってみよう

はじめに こんにちは、チューリング株式会社でソフトウェアエンジニアをしている矢部(和)です。 今回は、弊社内で最近よく利用されている便利な可視化ツール Rerun を紹介します。 前半はRerunの説明を、後半は実際に簡単なコードを書いてRerunを使ってみたいと思います。 この記事は、社内合宿のテックブログ作成チャレンジで弊社の嶋谷が執筆したRerun解説編を元に

チューリングの自動運転システム開発環境と、それを支える開発ツールたち

はじめに こんにちは。チューリングのDriving Softwareチームのマネージャーを務めている渡邉(@sangotaro)です。Driving Softwareチームは、チューリングの自動運転システムの開発を担当するチームで、自動運転AI以外の領域、例えばシステム制御やソフトウェアインフラの構築などを手掛けています。 先日、チームで栃木県の那須に開発合宿に行き、「約3時間でテックブログを

自動運転開発を始めたい人必見!MetaDriveでお手軽シミュレーション!

はじめに こんにちは!Turing株式会社のドライビングソフトウェアチームに所属している堀ノ内です! 今回は弊社で導入を検討している自動運転開発用シミュレータについてお話させて頂きます。以前のブログにて自動運転開発におけるシミュレータの必要性についても言及しておりますので合わせてご覧ください。 これまでTuringではCARLAというシミュレータを使っていた

Pythonのプロジェクト管理ツール uv のv0.5.3までの便利な機能 - dependencies編

Python Advent Calendar 2024の7日目です。 この記事ではuvについて、v0.5.3までのアップデートで個人的に便利だった機能を依存関係に焦点を当ててまとめました。 uvは高速なPythonパッケージとプロジェクト管理ツールです。2024年8月20日にuvのバージョンがv0.3.0にアップデートされて以来、広く使われるようになりました。 以前に以下の記事をまとめています。これからuvを使いた
OSZAR »