Information for ML/MLOps Engineer

 
本ページでは、 ML(機械学習)エンジニア/MLOpsエンジニアに関する情報をまとめています。 主な読者として、カジュアル面談や応募を検討中の方、面談・面接前の方を想定しています。 CADDiのエンジニア採用全般については、こちらのページをご覧ください。
 
📝目次
 

1.CADDiの事業とML技術

 

なぜCADDiは機械学習に投資をし続けているのか

 
① 既に機械学習の技術が顧客価値・事業価値の向上につながっており、今後も機械学習領域の強化が事業価値向上に寄与するため
  • 私たちが提供する図面データ活用クラウド「CADDi DRAWER」は、製造業のバリューチェーン(※)改革を成し遂げるために「情報を資産に変えるデータインフラ」になることを志しています。 ※バリューチェーン:商品やサービスが顧客に提供されるまでの一連の活動を「価値の連鎖」として捉えたもの。製造業においては、原材料調達から製造、出荷・物流、販売、アフターサービスまでの一覧のプロセスを差しています
  • その第一歩として、足元では主に「2D図面の解析・図面検索」の領域に注力しています。 「図面」は多くの製造業で「最重要データ」として認識されており、製造業におけるコミュニケーションプロトコルとも言えます。しかし、人間にとっては読みやすい形式だが、機械が処理しやすい形になっていないが故に過去のデータが埋没して資産として活用されず、知見の共有が進まなかったり、同じことを繰り返す必要がある、といった課題を抱えています。
 
 
  • 上記の課題に対して、私たちはMLを中心とした画像解析技術を使って図番・材質・表面処理,・母材形状・板厚…など検索・活用・調達観点で重要なメタデータを抜き出す技術を開発しました。また、キーワードだけでは表しきれない、形状も含めた「類似図面」を示唆する技術も開発することで、過去の情報を参照し、活用することを可能にしました。
  • CADDi DRAWERには、”画像による図面の類似検索”や”図面特有の認識(寸法推定や製造業ドメインに特有な記号など)”が目玉機能として搭載されており、これらの機能が新規導入や利用拡大の後押しとなるなど、ユーザー体験の向上や事業の拡大に大きく貢献しています。
  • 現状でも機械学習の技術はプロダクトにとって不可欠なものになっていますが、現在のプロダクトでできることや精度に対してお客様も100%満足している訳ではなく、実際にフィードバックをいただく機会も多いです。今後の進化への期待も込めてCADDi DRAWERを活用してくださっており、更に顧客価値を大きく向上できる余地が沢山残されています。 ※具体事例は「CADDiはML技術で何をしているのか/しようとしているのか」にも記載
  • 図面解析や図面検索等の領域では、デファクトスタンダードといえるサービスやプロダクトがまだ存在していません。この領域を磨き込むことで技術的優位を確かなものとし、グローバルで戦えるプロダクトになることを目指しています。
 
② アルゴリズム×機械学習の組み合わせがCADDiの技術的な強みであるため。また、今後もデータ量・データの種類の増加が見込まれ、機械学習によるレバレッジが効くようになっていくため。
  • 創業当初からキャディにはアルゴリズムに強いエンジニアが多く在籍しており、当初はアルゴリズムの技術を中心に据えて図面解析に取り組んでいました。 事業が拡大する中で取り扱うデータの量が増えたり、2D図面に向き合う中で、アルゴリズムによる精度改善のみでは難しいことが分かってきたので、2021年頃からML技術を使った研究開発にも取り組んできました。
  • 現在は目的に合わせて、適材適所でMLとアルゴリズムを組み合わせてサービスを提供しており、それらがキャディの技術的な強みのひとつになっています。たとえば、図面と言ってもそのフォーマットは様々ですが、顧客に依ってはある程度パターンが決まっています。その特徴を生かして、アルゴリズムの技術で図面データの文字列を読み取り、構造化したデータを蓄積しています。しかし、アルゴリズムだけでは対応しきれない(例えば、スキャン図面、ノイズが多い等…)部分も多く、ML技術を使った解析が必要不可欠です。
  • 現在、顧客1社あたりの取扱い図面枚数はおよそ数十万枚〜百万枚程度となり、総取扱枚数も1年前と比べて飛躍的に向上しています。今後はエンタープライズ向けのビジネスにも力を入れていくため、顧客1社あたりの図面枚数・総図面枚数共に増加し、更にML技術のレバレッジが効くステージになっていきます。
  • データの種類といった観点でも、現在は主に「2Dの図面データ」に向き合っていますが、製造業のバリューチェーン上には仕様書・サプライヤ情報・見積データ・発注データ・設計データ(3D含む)・原価管理データ・工程設計・品質管理データ…etc、必要不可欠なデータがまだまだ多く存在しています。今後、事業の拡大に伴い、それらの領域にも範囲を広げていくため、ML技術が必要な場面が増えていく見通しです。
  • 現在はメタデータの付与や類似図面の検索といった「情報を読み取る、探す、活用する」工程に寄与する技術開発を中心に行っていますが、今後はそれらのデータを活用して示唆を出し、ユーザーがよりよい意思決定を行えるようにするための開発を行っていく予定です。
 
(参考:CADDi DRAWERで取り扱っている図面のサンプルイメージ)
 

CADDiはML技術で何をしているのか/しようとしているのか

 
①類似図面検索の精度向上
  • 「類似図面検索」とはある図面画像をクエリとして入力して、図面を登録しているデータからクエリに似ている順に取得することです。「製造しようとしているある図面に似た図面が過去にどのくらいの金額で作られているか」を知ることで調達コストの適正化につなげるなど、様々なユースケースの活用が考えられます。
  • 類似図面検索はプロダクトのリリース時から目玉機能として導入の決め手になっており、CADDi DRAWERの価値の源泉になっています。
  • 当初から扱ってきた金属加工部品図面に関しては精度改善をしてきましたが、まだまだお客様からフィードバックをいただくことも多いです。また、一口に図面といっても金属加工図面だけでなく様々な種類の図面があります。分野が異なる図面においてもお客様の価値に繋がるよう精度を高めていきたいと考えています。
 
図面OCR(Optical Character Recognition)
  • 図面には一意に定める図番や寸法、材質など重要な情報が文字として書かれています。そのため、文字列で検索して必要な図面を探し出すためには図面中の文字列が認識できている必要があります。類似図面検索は似たような図面を検索することができますが、実際は寸法や材質なども製造コストに大きな影響を与えるので、組み合わせて検索できることが重要になります。
  • 現在は3rd Partyのサービスによって実現していますが、図面特有の寸法表現(Φなど)を適切に処理できない、製造業特有の語彙に弱いなどの理由で認識性能に課題がありますし、コストが高いという課題もあります。そこで、図面用のOCRを独自に開発しており、置き換えに向けて開発を進めています。
  • CADDi DRAWERは既に海外でも販売を開始しています。図面はグローバル共通の製造業におけるコミュニケーションプロトコルであるため、やるべきことが180度変わる訳ではないですが、インチ表記や海外規格への対応等、アジャストをしていくことで、よりグローバルで使われるプロダクトになることも目指しています。
 
 
③図面特有の記号認識
  • 図面には文字以外にもどういう加工をしてほしいかを表す特別な記号が規定されています。例えば、「溶接記号」「表面粗さ記号」「幾何公差記号」といったものです。これらの加工が多かったり、厳しい精度を要求している場合、製造コストも上がりますし加工できるサプライヤーさんも限られてきます。これらの記号が認識できることで、顧客にとっては見積やサプライヤー選定の精度向上につながるなど、よりCADDi DRAWERを利用する価値につながります。
  • これまでの取り組みにより、よく使われる代表的な溶接記号は認識できるようになってきました。現在は、認識できる記号の種類を増やしたり、継続的に精度を高めるための施策を進めています。
 
表面粗さJIS記号の例(表面粗さと溶接を図面で指示するJIS記号より引用)
 
 
未来に向けた構想
  • ①~③に記載したとおり、直近では、類似図面検索や図面用のOCRや記号認識の精度向上・提供にフォーカスしており、図面画像における取り組みが多いです。図面は製造業のバリューチェーンで広く使われるコミュニケーションプロトコルであるため、まずは図面領域で強みを確立することが顧客価値視点でもビジネス視点でも重要だと考えているためです。
  • 将来的には、図面画像を起点として製造バリューチェーンの中で産まれる見積金額、発注金額、デザインレビュー書類、品質履歴、設計データ(3DCAD)等あらゆる種類の情報も扱えるようにしようとしています。それらのデータを活用するため、ドキュメント解析(自然言語処理)や3D形状解析にも技術領域を広げていきたいと考えていますし、集めたデータを活用してよりよい意思決定の質を上げるための示唆だしなど、私たちがML技術を使ってやりたいことはまだまだたくさんあります。
 
(参考:製造業のバリューチェーン上に存在する様々なデータのサンプルイメージ)
 
 
 
 

ML技術がどのように顧客価値や事業価値に寄与しているのか

 
実際にDRAWERユーザーのお客様よりいただいた声から、ML技術が関係するポイントを抜粋しました。(CADDi DRAWERサービスサイトの導入事例より引用)
 
類似図面検索に関わるもの
株式会社ケーテー製作所様 図面のデータをフォルダに溜めて管理しているのですが、部品名は同じなのに、形状が全く違うということがよくあります。
『CADDi DRAWER』の紹介を受けてことにとても驚きました。当社の現場にフィットすると魅力を感じました。
富士油圧精機株式会社様 設計部門では、今まで多くの時間がかかっていた該当図面の検索が数秒程度と大幅に短縮された。。図面を探す時間が大幅に減り、設計作業の効率が大幅に向上した。
 
 
有限会社大東鉄工様 『CADDi DRAWER』の類似図面の検索は非常に便利でした。。導入においては、使いやすさが重要だと思っていました。機能だけでなく、直感的に使えるかが非常に大事です。製造現場も含めた色々な人が使う場合は特にそうです。
 
図面OCRに関わるもの
株式会社草川精機様 過去図面や類似図面を探す際には、ので、探し出す時間も大幅に減る。紐づけられた過去の受注情報が確認できれば、見積もりのスピードや精度も上がる。
 
有限会社富張製作所様 他のサービスの多くは、図面データを社内で決めたルールに基づき、リネームして登録。顧客別などの管理ルールに基づき登録した図面をシステム操作で整理し、材質、板厚などの付加情報を追加したい場合は、別途手入力する必要があります。新たにシステム導入する際は、一段とこの負荷が高くなります。また違う人が同じ図面名称でデータをアップロードすると上書きか二重登録になってしまう。CADDi DRAWERは同じデータは登録済みではじいてくれます

2.CADDiの開発組織と機械学習チーム

 

開発組織における機械学習チームの立ち位置

 

Drawing Feature Extraction Team(図面解析 ML+MLOps)

  • 開発組織における位置づけ:現在は「DRAWERに登録される非構造化データを解析し、ユーザがデータを検索・活用し易い状態を提供すること」を目的に活動しています。目下では下記を役割として定義しています。 ”機械学習やアルゴリズムの技術(手段は問わない)を用いて、図面に描かれていて、DRAWERのサービス提供に必要な情報をできる限り高精度、高速に推論するモデルを作成する。また、成果物を素早く、かつ安全にDRAWERにデリバリーすることで、新しい価値をプロダクトに反映し続ける。事業の技術不確実性を低減する役割を担う。”
  • MLエンジニアとMLOpsエンジニアは、Drawing Feature Extractionチームとして一緒に活動しています。エンジニアの他、図面など製造業のドメインの知識を持つプロダクトマネージャー(以下、PdM)もチームに所属しています。MLモデルの開発からDRAWERで認識結果が使える状態にするデリバリー・運用までを担っています。
  • Stream-aligned teamのPdMやエンジニアとどういう機能を作るかを議論し要件を詰めながら、必要であればDRAWERに溜まっているデータにアノテーションを付与してデータセットを作り、ML開発をしています。ロードマップを基にPdMの要求でどういう機能を作るかが決まる場合もありますが、エンジニア発信の課題提起に応じてカスタマーサクセスやお客様の利用状況を情報収集しつつ開発を進めることもあります。(参考資料:ML開発の流れ
  • デリバリーでは自チームで管理しているML API基盤を用いてWebAPIとして提供しているものがあり、Platform teamであるWorkflow Engineチームが開発している大量データ処理基盤と連携してDRAWERで認識結果が使える状態にしています。(参考資料:ML API基盤
  • また、機械学習に使うデータを含む機械学習環境はSREチームやセキュリティチームとも協力しながら、セキュアかつ開発体験が良い環境を目指し改善を続けています。

Data Management Team

  • データエンジニアは、データマネジメントチームとして活動しています。DRAWERの全員がデータを見て考える文化を作ることを目標に、関わるデータを収集し活用するデータ基盤の作成を担っています。データを見ながらプロダクト開発するサイクルを作る状態を組織全体にenablingするために活動しています。
  • ML/MLOpsチームとは近いグループに置くことで、実際に作ったものがどれくらい・どのくらい使われているかのデータを基に、何をするか・どう改善するかを議論し、改善と価値提供のサイクルを回すことを目指しています。
 

メンバー

チームの取り組み

 
チームのスキル向上のために週に1回ローテーションで勉強会を開いています。 テーマを設けることもありますが基本はML/MLOps関連のことであれば何でもよいです。 ML関連でこういう論文を読んでみた、試してみたといった話もありますし、MLOps関連ではGoogle Cloudにこういう機能が追加された、マネージドサービスを試してみたといった内容を紹介しています。
 

開発の特徴

 
CADDi ML/MLOpsチームの開発の流れやアーキテクチャはテックブログで紹介していますので、ぜひご覧ください。
 

3.採用関連情報

募集要項

現在募集中のML関連職種です。
 
 

採用プロセス

 
基本のフローは下記となります。 応募~内定は1カ月程度が平均的ですが、お急ぎの場合はご相談ください。 極力ご転職活動のスケジュールに間に合うよう調整いたします。
 
  • 書類選考
  • オンラインのコーディングテスト
    • アルゴリズムの知識や回答のスピードよりも、コードを通して「一緒に開発をすすめていくイメージが持てそうか」を重視しています。テストケースに正解できているかに加えて、コード品質(可読性等)も確認しています。すべてのテストケースに正解できていない場合であっても、どの程度正しいアプローチができているかを見ていますので、最速で解答を提出することより、一定のコード品質を担保した上で提出いただくことを期待しています。
  • 人事面談
    • 選考要素はなく、条件面等のすり合わせや選考を受けるにあたっての疑問解消の場です
  • 技術面接(マネージャ、エンジニア)
    • 技術的な専門性、業務への取り組み方、今後やっていきたいこと等をお伺いし、配属先チームと候補者様がwin-winの関係を作ることができそうかを確認しています。
  • 最終面接(CTO小橋)
    • 候補者様のご経験や大切にしていることをお伺いし、入社後継続的に成長・活躍いただいてCADDiと候補者様でwin-winの関係を作ることができそうかを確認しています。
  • オファー面談
    • 条件面や期待すること等をお話しします。
※必要に応じ、追加の面接や面接をご提案する場合もございます。
※ご希望に応じて、選考途中でも社員とのカジュアル面談をセットいたします。ご相談ください。
 

カジュアル面談

MLメンバーとのカジュアル面談を随時受け付けています! 以下よりお気軽にお申込みください。
 
 

ML/MLOps関連コンテンツをすべて見る