はじめに
こんにちは、岩元です。
今回は生成AIを利用した研究開発のため作成した、「AIえほん図書館」というWebアプリケーションについて共有します。
スクリーンショット
アプリ制作の目的
1.AIツールを使用した開発を試してみる
2.いろいろなAIツールに触れる
開発者のバックグラウンド
- 日常的にChatGPTなどのAIを質問のために使用
- 生成AI APIの使用経験なし
- VSCodeをメインのエディタとして使用
- Cursorを活用した開発は初めての経験
なぜえほん作成アプリを選んだのか
子育てをしている中で、「同じ絵本ばかりだと子供も親も飽きてしまう。
でも物を増やしたくはないし、頻繁に絵本を買うのも大変」という気持ちがありました。
今回AIを利用して作りたいサービスを考えたとき、AIで簡単にオリジナル絵本が作れるアプリケーションがあったら面白いなと思いました。
使用技術
- bolt
- Cursor(開発用IDE、コード生成のComposer機能をメインに活用)
- Firebase(Googleログインの認証機能)
- Gemini API(ストーリー用生成AI)
- DALL-E 3(イラスト生成AI)
アプリケーションの概要
AIえほん図書館の主な機能:
- 対象年齢、主人公、テーマを選択
- 生成ボタンを押すとストーリーが作成される
- ストーリーに合わせたイラストが作成される
開発プロセスと良かった点
Cursor Composer
composer機能をしっかりと活用したのはこれが初めてでしたが、とても有効な機能でした。
主な利点 :
- 手作業での作業時間を削減し、開発プロセスを効率化
- コンポーネント分割も適切に行なってくれる
- Composerに指示を出すだけで、複数のコンポーネントやページを一括で修正してくれる
DALL-E 3
えほんのイラストに適した画像を出力してくれました。
主な利点:
- 複雑な指示にも対応可能
- 高いカスタマイズ性
- 高画質
直面した課題
イラストの精度が課題でした。
4つのシーンに分けてストーリーを生成し、シーンごとのストーリーからイラストを生成していましたが、各シーンごとにイラストのテイストや主人公が若干異なっていたり、そのシーンとは関係性のないイラストが生成されてしまったりしました。
プロンプトの調整や、使用技術の変更を試して対応しました。
まとめ
これまでコードを手書きで書いてきましたが、今回AIツールを使用して、こんなにも簡単かつ短時間でアプリケーションを作成できることにとても驚きました。
今後も様々なAIツールを試し、さらなるAIツール活用の可能性を探っていきたいと思います。