Google Geminiのプログラミング続編(1)

2024年3月1日 08:43

Google Geminiのプログラミング、継続中。体験することで、理解することも増えています。

さて、Google Geminiのプログラミングを、Google Colab上で、Pythonを使って行い始めたことを、前回のnoteで書きました。

業務でも、生成AIを使うことが増えてきていると思いますが、今は生成AIの「良い部分・悪い部分」「できること・できないこと」などを理解するフェーズなのでしょう。

会社の中には、コンピューターのクラウド環境の導入の時と同様に、情報が外部に漏洩することを恐れて、会社のコンピューターから、ChatGPTや、Google Geminiへの利用禁止の会社もあるようです。その判断は、本当に適切な判断なのでしょうか？

多くの場合は、生成AIがよくわからないので、判断を先延ばししているだけではないでしょうか。

そこで、私は実際の生成AIをブラウザーから使うのではなく、プログラミングを行うことで、少しづつ体験して、理解しようとしています。その後もさらに、少しづつプログラミングを行ったので、続編をお伝えします。

写真から、その料理の作り方をAIに教えてもらう

Google Geminiに、次に行わせたことは、インターネットに公開されている画像の分析です。それも、料理の画像の分析です。

今まで、私たちは写真の料理を作らせたい場合は、

料理の写真をGoogle の画像検索で調べ、料理名を知る
その料理名を使って、Googleで料理の作り方を調べる

という、２段階のステップが必要でした。しかし、このAIの活用では、写真をGoogle Geminiに渡すだけで、料理の作り方を調べることができます。

ただ、この例でもわかるように、多くの生成系AIは、すでに公開されているWebサイトの情報などを参照しているので、料理の作り方を丁寧に説明できる料理と、そうでない料理がありそうです。

Google Geminiに追加質問を行う

生成系AIを使っていると、最初の質問の仕方が少し悪いために、適切な回答を得られないことがあります。その場合、生成系AIに追加の質問を行います。そのプログラミングを行ってみました。

Google Geminiは、写真の撮影場所を推定できる！

私がこのプログラミングを行うのに、あまりGoogle Geminiに関するWeb情報がないので、さまざまなサイトを訪問しながら情報を集めるのですが、あるサイトに、Google Geminiは、写真の撮影場所を推定させることができることが書かれていました。

そこで、実際に自分の撮影した写真（撮影場所が特定できている）もので、実行してみました。このプログラミングは、写真のURLを変えれば、皆さんの写真でも、推定できるので、皆さんの場合、Google Geminiで、才津英場所の特定ができているか、教えて頂けると嬉しいです。ちなみに、料理の写真などで、同じことを行うと、その料理店の名前なども、推定してくれますよ。

Google Geminiには、temperatureというパラメーターがある

そう、このtemperatureというパラメーター、直訳すると「温度」なんですが、作用としては、「創造的」か「そうでないか」をチューニングする変数なので、勝手に「創造性パラメーター」と訳しています。

この何気ない、「創造性パラメーター」は、生成系AIの出力には大きな影響を与えます。同じ「一寸法師」の推定でも、変数が違うだけで、まったく別の「物語」になりましたよ。

安全性制御も確認しました

このプログラミングを行っている最中に、Google は、画像生成で、問題に直面しました。

生成AIは、どのサービスも進化の途中なのと、利用者とのコンセンサスを作成している途中なので、このような問題も起きるでしょう。そして、Google Geminiには、最初からこのような問題に対応するために、安全性制御という設定が可能になっています。

なので、さっそくその安全性制御についても、プログラミングして実験してみました。

今回は、以上です。皆さんも、ぜひ体験してみてください。生成AIは、「習うより、慣れよ」というフェーズなのです。今は。

もし良ければ、サポートをお願いします。今後の執筆のための、調査費用などに、有効に活用して、記事としてお戻しします。