# #71 hirokikyさんをゲストに 自然言語処理系AI Chat GPT / Whisperの話
# Note
Guest:
ky(さん)と呼んでください!Python大好き、Webサービス大好き、自然言語処理も大好きなエンジニアです。ぜひTwitter(@hirokiky)でフォローしてください!株式会社ゼンプロダクツというスタートアップの代表取締役です。Shodoという、日本語をAIが校正してくれるWebサービスを開発・運営しています。オンライン上でMarkdownの執筆・レビューができるサービスですので、テックブログの運営にもおすすめです。DjangoCongress JPというカンファレンスも毎年主催しています。
Contents:
00:00:00 スタート
00:00:06 ゲスト hirokikyさんの紹介
00:01:29 2022年2月に自然言語やAIの話をしている振り返り。GPT-4の話もしていた
00:06:07 kyさんの自己紹介
00:08:24 terapyonの興味範囲。APIを使うより中身を勉強したい。
00:09:26 GPT-4はオープンソースでない寂しさがある
00:12:42 いまの自然言語系AI開発は飛行機ビジネスみたいにお金がかかるけど、ファインチューニングとかでオリジナルなものが作れる魅力はある
00:14:00 terapyonがOpen AIのWhisperで文字起こしをやっていてチューニングに挑戦中。モチベーションについて
00:18:18 AI系の技術スタックの理解が一つづつ難しい。huggingface, Datasets, DataLoader, transformers, PyTorch, PyTorch Lightning
00:27:51 pyhackなどのコミュニティや勉強会に助けられてきたので、MLの活用形のコミュニティはあるかな?
00:30:37 研究ではないMLエンジニアリングや運用といったことのノウハウ共有があると良い
00:36:31 Shodo.inkにChat-GPTの導入は面白いアイデアだと思った
00:41:51 AI生成やChat-GPT関連のライセンスや著作権問題は考えていきたいし、倫理的な問題になるかも
00:44:57 AIって最後は倫理問題かな
00:45:40 AIで鬱にならないで欲しい話、エンジニアリングとかまだまだ価値がある
00:49:45 詰め込み教育的な答えを出すのはChat-GPTのほうがすごいと思う
00:50:37 意外と自我っていうのは人間の物質的なものがあるかも話
00:52:36 Chat-GPTなのかWhisper触ってる場合じゃないのか?
00:54:15 1年前の時にスタジオを作って動画活用って言った振り返り
00:55:37 terapyonは本の紹介とかをプログラミング技術の動画講義を作りたい
00:59:39 一般社団法人PyCon JP Associationの理事にインタビューをリモートでやって動画にまとめた話 https://youtu.be/gr9t-P9CrsM
01:03:34 動画編集に文字起こしツールWhisperが大活躍した話
01:12:47 寺田が年齢関係なくガツガツやっているのを、他の人も真似しないかな?
01:21:58 Podcast収録したらまたやる気ができたのでもうちょっと勉強してみる
01:28:43 研究は面白いが、成果がでないこともあるので大変でもある。
01:29:27 AI系の学習タスクは、手元でやるか?クラウドでやるか? VRAM 8GB/12GB or クラウド
01:32:01 Whisperをインテル系CPUで動かすととてつもない時間がかかるが、Appleシリコンならそれなりに早い
01:35:31 WhisperをプロダクションでAWSで動かしたいときはkyさんが相談に乗ってくれる