新入社員が2人で生成AIアプリを作った話 〜開発から特許出願まで〜 (original) (raw)

こんにちは、ひさふるです!

私は現在、KDDIアジャイル開発センター(以降KAG)という会社の新入社員として働いています。

この度、同じくKAGの新入社員である沢井と共に、インターン+研修の一環として生成AIを活用したアプリケーションを開発し、その関連技術を特許出願しました!

そこで今回は、開発から特許出願までの流れをご紹介したいと思います!

自己紹介

今回のアプリは、KAGの24卒新入社員である私(久古)と沢井の2名で作成いたしました。

私と沢井はもともと同じ大学の友人であり、大学時代から一緒にアプリ開発を続けて来ました。

KAGへの内定をキッカケに、KAGで生成AIを活用したアプリを作りたい!と志すようになりました。

mojikyo45_640-2.gif

左が沢井、右が久古

アプリケーション開発のキッカケ

内々定者イベント

2023年6月、KAGから内々定を貰っていた私達は内々定者向けイベントに参加していました。

そこで、KAGが自社プロダクトの作成にも力を入れようとしていることや生成AI活用を目指していることを知った私達は、「自分たちで今、生成AIを活用するとしたらどのようなアプリを作るか?」を考えてみることにしました。

音声生成AIとの出会い

そこから、2023年6月から8月中旬まで、私達は生成AI関連の市場調査を実施し、当時の生成AIを取り巻く市場環境を次のように分析しました。

  1. コンペティターが多い:ChatGPTなどを利用したアプリは多数ローンチされている一方で、独自性が低いものも他社に多く真似されやすい。
  2. 音声生成AIは(良くも悪くも)市場規模が小さい:特にSE(Sound Effect)生成AIを活用したアプリは少ない
  3. SEの需要の増加:YoutubeやTicTokの普及により個人でSEを利用する人が増えた

よって、私達が考えたのは以下のような戦略です。

生成AIによってSEを作成、それを投稿・共有できるプラットフォームを作れば使ってもらえるんじゃないだろうか??

アイデアのブラッシュアップと提案

SE生成AIの抱える問題点

しかし、思いついたSE生成プラットフォームには大きく2つの解決すべき問題点がありました。

  1. 生成モデルの独自性が無いこと:自分たちで生成AIを一から作るのは大変(というかほぼ無理)なので他社モデルを使用したいが、それだと独自性が無い
  2. テキストによる音声生成の難しさ:音をテキストで説明することは画像を説明するよりも難しいため、狙った音声が生成されにくく、出力される音声のバリエーションが無い

これらの問題を解決するために私達が目をつけたのがベクトルデータベースでした!

ベクトルデータベースはデータをベクトルとして保存することで、音声や画像などベクトルで表現出来るデータの検索に特化したDBです。

このベクトルデータベースと生成AIを組み合わせることで、SEを生成するだけでなく直感的な検索が出来ることをアプリの強みにしよう、と考えました。

KAGへの提案

アプリのアイデアがまとめ終わった私達は、一旦KAG側へこのアイデアを伝えてみることにしました。

当時学生である私達が考えたプロダクトが、会社としてどう判断されるのかに興味があったためです。(今思えばかなり無謀な挑戦だったと思います笑)

返答はすぐに返ってきて、プロダクトの内容を社長・副社長・部長含む5名の前でプレゼンして欲しいとのことでした。(今考えても、非常に貴重な機会を与えていただいたと思っています)

プレゼンの結果は良好、すぐにインターンとして試しに開発をしてみて欲しいと言われ、二つ返事で了承したのを今でも覚えています。

このフットワークの軽さこそが、KAGの魅力であると思っています。

開発からKAGレビューでの発表

プロダクト開発

実際にインターンとして開発を行ったのは2023年の10月から2024年の3月まででした。

インターン中は技術サポートとしてKAGのテックリードである岸田さん(@makishy)についていただき、開発を進めました。

実際に、出来上がったプロダクトがこちら↓

mojikyo45_640-2.gif

※プロダクト詳細については別記事で詳しくご紹介しています!ぜひご覧ください!

KAGが得意とするアジャイル開発の流動的な要素と青色のKDDIカラーから連想されるをテーマに、"水滴がポチャリと落ちる音"を意味する"Plop"をアプリケーションの名前としました。

アプリ内ではSE生成の他、SE検索も行うことができ、他のユーザーが生成したSEを相互に活用出来るようになっています。

KAG社内向けの発表

実際にサービスが完成後、岸田さんより社内のレビュー会(KAGレビュー)で作ったサービスを発表してみたら?とのお誘いを受け、挑戦してみました。

インターン生ながら全社員の参加するイベントでの発表機会をいただき、緊張しながらも発表を終え、たくさんのコメントをいただくことが出来ました!

入社から特許出願まで

入社後は研修が続き、こちらのアプリに時間を割けない日々が続きましたが、このまま終わらせるのは勿体無いとの声を受け、まずは特許出願を目指しました。

音声の生成と検索を組み合わせ、更にUIの工夫もあるという点を押し出し、現在は特許出願まで無事終えることが出来ました。

おわりに

今回は新入社員2人が生成AIを使ったWebアプリを作成し、特許を出願するまでの流れをご紹介しました。

私達二人としても、自分たちの思い描くアプリケーションを形に出来たことは本当に嬉しいですし、特許出願の機会までいただけたことは大変良い経験となりました。

今回作成したアプリケーションに関しては、今後も何らかの形でプロジェクトを進めていくつもりですので、続報をお待ち下さい。

KDDIアジャイル開発センターには、このような社員・内定者の自主的な活動を積極的に後押しする社風があります!

今回の記事でKAGに興味を持たれた方は、ぜひ公式サイト・採用情報等もご覧ください!