生成AIまとめ

生成AIまとめ
りある

生成AIの話題が多すぎて、やや混乱しています。
なので有名どころだけでも整理したい。

ロボ君

主要なものをピックアップして更新していきマス。

目次

テキストAI

AIブームの先駆けとなったChatGPTに代表される、会話形式でテキストを書いてくれるAIです。
テキストAIの皆さんには、基本的に「~の説明を箇条書きでお願いします。」という形で、自己紹介してもらっています。

ChatGPT

りある

最速でマルチモーダル化(文章も画像も音声もなんでもわかるAI)しているAI。一部機能はBingAIで無料で使えるのでありがたいです。

  • OpenAIによって開発された、自然言語処理を行う人工知能(AI)モデル。
  • 大規模なデータセットでトレーニングされ、自然な対話を生成する能力を持つ。
  • 多岐にわたるトピックや質問に対応し、会話を通じて情報を提供したり、ユーザーの質問に答えたりする。
  • 文脈を理解し、前後の会話から情報を抽出して適切な回答を生成する。
  • さまざまな言語に対応しており、世界中のユーザーとコミュニケーションを図ることができる。
  • 新聞記事、ウェブページ、会話など多様な情報源を学習し、その豊富な知識をもとに応答を生成できる。

https://chat.openai.com/

ChatGPTの開発者と特徴

開発者:

ChatGPTは、アメリカ合衆国の非営利研究団体であるOpenAIによって開発されました。
OpenAIは、イーロン・マスク氏やサム・アルトマン氏などによって設立された団体で、人類全体に利益をもたらすような人工知能の開発を目指しています。

特徴:

ChatGPTは、GPT-3.5やBardなどの最先端の生成AIモデルをベースにしたチャットボットで以下のような特徴があります。

1. 自然な会話:

人間と自然な会話ができるように設計されており、質問への回答だけでなく、雑談や議論も可能です。

2. 豊富な知識:

膨大な量のテキストデータで学習されており、様々な知識を持っています。

3. 創造的な文章生成:

詩、小説、脚本など、創造的な文章を生成できます。

4. 質問への詳細な回答:

質問に対して、詳細な回答を生成できます。

5. コード生成:

プログラミング言語のコードを自動で生成できます。

6. 多言語対応:

日本語を含む、複数の言語に対応しています。

7. 無料プラン:

一部機能に制限はありますが、無料で利用できるプランも提供されています。

8. 継続的なアップデート:

最新のAI技術を取り入れ、機能や性能が継続的に向上しています。

9. オープンな開発環境:

開発者向けAPIを提供しており、独自のアプリケーション開発も可能です。

開発者情報:

まとめ:

ChatGPTは、自然な会話と豊富な知識を備えたチャットボットで、質問への回答だけでなく、様々な用途で活用できます。

利用方法:

ChatGPTは、OpenAIの公式サイトから無料で利用できます。
アカウント登録が必要で、利用規約に同意する必要があります。

注意点:

ChatGPTは生成AIモデルであり、生成される文章が常に正確であるとは限りません。
生成された文章は、あくまでも参考情報として利用してください。

Microsoft Copilot

Microsoft Copilotは、MicrosoftとOpenAIが協力して提供している生成AIを活用したサービスです。
これまで「Bing Chat」として提供されていた生成AIの新しい名称になります。

Microsoft Copilotの主な特徴:

  1. GPT-4ベースのLLM: 大規模言語モデルを搭載しており、テキストによる回答だけでなく、画像処理や画像生成も可能です。
  2. Microsoft 365との連携: WordやExcelなどのデータを元に表や図、PowerPoint資料の自動作成やデータの解析までが可能です。
  3. チャット形式での検索: ユーザーが質問するように、例えば『冬休みに子どもを連れていける雪遊びスポットはどこですか?』のようにチャット形式で検索できます。
  4. 画像作成: ユーザーが表現したい内容を言葉にして、そのまま「Copilot」に入れることで、画像が出てくる。
  5. 創作作業: 何か新たに作り出さないといけないという時に、従来の検索なら、例えば「メール テンプレート 挨拶文」などで検索し、でてきたテンプレートを自分でカスタマイズする必要がありましたが、「Copilot」を使えば、自分にパーソナライズされたドラフトが瞬時に生成されます。

また、Microsoft Copilotには、無料で利用できる「Copilot」、個人向けの上位サービスである有料版の「Copilot Pro」、法人向け有料サービスの「Copilot for Microsoft 365」の3種類があります。
それぞれのサービスでできることや料金、特徴については、詳しくはリンク先をご覧ください。
ただし、情報は2024年2月14日時点のもので、最新の情報は公式ウェブサイト等でご確認ください。

https://copilot.microsoft.com/

GoogleGemini

りある

AIモデルがGeminiになった!文章の生成が速いし、より自然に。

GoogleGeminiの開発者と特徴

開発者:

GoogleGeminiは、Google AIによって開発された大規模言語モデル(LLM)です。
Google AIは、人工知能の研究開発を推進するGoogleの部門であり、これまでにBERTやLaMDAなど、数々の画期的なLLMを開発してきました。

GoogleGeminiの特徴:

1. 膨大な学習データ:

GoogleGeminiは、書籍、記事、コード、Webページなど、1.56兆語もの膨大なデータセットで学習されています。
これにより、人間に近いレベルの理解力と表現力を持つことが可能になっています。

2. 多様なタスクへの対応:

GoogleGeminiは、以下のような多様なタスクを実行できます。

  • 文章生成: ブログ記事、広告文、小説、詩、脚本など、様々な形式の文章を生成できます。
  • 翻訳: 100以上の言語間で翻訳できます。
  • 質問応答: 質問に対して、正確かつ詳細な回答を提供できます。
  • 要約: 長い文章を理解し、簡潔な要約を生成できます。
  • コード生成: プログラミング言語のコードを自動で生成できます。

3. 高い性能:

GoogleGeminiは、従来のLLMよりも高い性能を実現しています。

りある

性能はこれからどんどん追いつき追い越すことになりそう。

4. 継続的な学習:

ジェミニは、Google AIによって継続的に学習されています。
これにより、常に最新の知識を取り込み、能力を向上させています。

開発者情報:

まとめ:

ジェミニは、Google AIによって開発された最新の大規模言語モデルです。
膨大な学習データと高い性能によって、様々なタスクを実行することができます。

https://gemini.google.com/

Claude

  • ClaudeはAnthropicによって作成されたAIアシスタントです。
  • 2022年に発表され、ChatGPTなどと並ぶ汎用AIの一つです。
  • 自然言語での対話、文章作成、分析、質問応答、数学、コーディングなどを支援します。
  • 自己学習機能を持ち、人間からのフィードバックで性能を向上させていきます。
  • 倫理的な判断能力を持ち、人間に害を与える可能性のある要求には従いません。
  • 公平性と説明責任を重視した設計思想に基づいて開発されています。

https://claude.ai/chats

Perplexity

  • Perplexityの開発者は、2022年に設立されたPerplexity AI社です。
    Perplexity(パープレキシティ)は、AI検索エンジンのひとつであり、主な機能には「Instant answers」(即時回答)、 「Context awareness」(コンテキスト認識)、 「Collaborative AI search」(協調型AI検索)がある。
  • Perplexityは短文や箇条書きで回答することがあり、文章力にはやや不安があるものの、情報の出所が確かであるため、記事の執筆時の情報収集や文献の検索に適している。
  • PerplexityはChrome拡張機能として利用可能であり、文章作成や情報検索に活用されている。
  • Perplexityは医学情報の検索にも活用されており、一般的な内容の全体像の把握や出典巡り、論文探しなどの視点で役立つことが示唆されている。

https://www.perplexity.ai/

リートン

リートンの開発者と特徴

開発者:

リートンは、韓国のAIスタートアップ企業である「Reeton Technologies」によって開発されました。
2021年4月に設立された比較的新しい企業ですが、韓国国内で高い評価を得ており、2023年にはCESで生成AIサービス初のイノベーション賞を受賞しています。

特徴:

リートンは、最先端の生成AIモデルをベースにしたオールインワンAIプラットフォームです。以下のような特徴があります。

1. 多様な生成機能:

  • 文章生成: ブログ記事、広告文、小説、詩、脚本など、様々な形式の文章を生成できます。
  • 画像生成: テキストから、オリジナルの画像を生成できます。

2. 高い汎用性:

上記の機能は、ビジネス、教育、エンターテイメントなど、様々な分野で活用できます。

3. 使いやすいインターフェース:

ブラウザ上で操作できるシンプルなインターフェースなので、専門知識がなくても簡単に利用できます。

4. 無料プラン:

一部機能に制限はありますが、無料で利用できるプランが提供されています。

りある

前はGPTだけだったけど、利用できるAIが増えてきてるのに無料。逆に怖い。

5. 日本語対応:

日本語の入力・出力に対応しており、日本語での利用も可能です。

気になる

来年はmeta、apple、amazonは出てくるでしょうね~。期待。

https://ai.meta.com/llama/

https://www.apple.com/

https://aws.amazon.com/jp/sagemaker/

NVIDIA

画像生成AI

DALL·E

  • OpenAIが開発した最新の画像生成AIで、自然言語のテキストから詳細な画像を生成できます。
  • ChatGPTの有料版で利用できますが、下記のBing Image Creatorなら無料で使えます。

https://openai.com/dall-e-3

Bing Image Creator→Copilotに統合されました

りある

天下のMicrosoft社パワーでDALL·Eが無料で簡単に使えます。

  • Bing Image Creatorは、Microsoft社が提供している画像生成AIツールです。
  • ユーザーが作成したい画像をイメージした指示文(プロンプト)を入力することで、文章に合った画像を4枚作成できます。
  • 画像の生成にあたっては、OpenAIが開発した「DALL·E」を使用しています。
  • Bing Image Creatorを使用するのに必要なのは、Microsoftアカウントと、bing.comにアクセスすることだけです。DALL·E やOpenAIのアカウントは必要ありません。

https://www.bing.com/images/create

Adobe Firefly

ロボ君

いまのところ唯一、無料で確実に著作権フリーな画像生成AIデス。

りある

いちおうOpenAIも、不正利用でない場合は著作権保証する宣言出したね。

著作権シールド
OpenAI は、システムに組み込まれた著作権保護機能によりお客様を保護することに尽力しています。本日、私たちはさらに一歩進んで、著作権シールドを導入します。お客様が著作権侵害に関して法的請求に直面した場合、私たちは介入してお客様を守り、発生した費用を支払います。これは、ChatGPT Enterprise および開発者プラットフォームの一般利用可能な機能に適用されます。

https://openai.com/blog/new-models-and-developer-products-announced-at-devday
  • Adobe Fireflyは、アメリカ合衆国に本社を置くソフトウェア企業「Adobe」によって開発されました。
  • Adobeは、IllustratorやPhotoshopなどのグラフィックデザインソフトウェアで知られています。
  • Adobe Fireflyは、大規模な画像データセットでトレーニングされた生成AI(Generative AI)です。
  • テキストの指示や、画像の例に基づいて、画像を生成することができます。
  • 生成される画像は、写真のようにリアルなものから、抽象的なアートまで、多岐にわたります。
  • 著作権の問題を解消するために、Adobe Stockに掲載されている画像のみを学習元としています。

https://www.adobe.com/jp/products/firefly.html

りある

ここから先はクラウドやDiscordの利用やダウンロードが必要なものなので、ややマニアック。

Canva

Canvaはブラウザ上でデザインを作成できるサービスで、このブログのサムネイルもcanvaで作成しています。
最近生成AIを取り入れたサービス(有料)を開始しているので注目しています。

Canvaの開発者と特徴

開発者:

Canvaは、Melanie PerkinsCliff ObrechtCameron Adamsによって2012年に設立されました。expand_morePerkinsは、学生時代にデザインソフトの使いにくさに不満を感じ、誰でも簡単に使えるデザインツールを作ろうと考えました。

特徴:

1. ドラッグ&ドロップ操作:

専門知識がなくても、ドラッグ&ドロップ操作で簡単にデザインを作成できます。

2. 豊富なテンプレート:

ポスター、チラシ、ロゴ、プレゼンテーション資料、名刺、SNS投稿画像など、様々な用途に対応したテンプレートが豊富に用意されています。

3. 素材の豊富さ:

写真、イラスト、アイコン、動画など、数百万点の素材が用意されています。e

4. 無料プラン:

基本的な機能は無料で利用できます。

りある

これがめちゃくちゃありがたい!

5. 商用利用可能:

Canvaで作成したデザインは、商用利用可能です。

6. 多言語対応:

日本語を含む100以上の言語に対応しています。

7. 使いやすいインターフェース:

シンプルで使いやすいインターフェースなので、初心者でもすぐに使い始められます。

8. 豊富なチュートリアル:

Canvaの使い方を学べるチュートリアルが豊富に用意されています。

9. スマホアプリ:

スマートフォンやタブレットでも利用できます。

10. チーム機能:

チームでデザインを作成・共有できる機能があります。

開発者情報:

まとめ:

Canvaは、誰でも簡単にデザインを作成できるグラフィックデザインツールです。
豊富なテンプレートや素材、無料プランなど、多くのメリットがあります。
デザイン作成に困っている方は、ぜひCanvaを試してみてください。

https://www.canva.com/

Stable Diffusion

基本はtext-to-imageモデル(言葉で画像を生成する)ですが、イメージから生成したり、自動補正する機能が追加されています。クラウドやPCで無料で使えます。

  • Stability AIによって開発されました。
  • テキスト入力に基づく画像生成の精度と安定性が向上しています。
  • 画像のスタイルや雰囲気をカスタマイズすることができます。
  • 画像のサイズや解像度を調整することができます。

https://stability.ai/stable-image

Midjourney

基本有料になってきましたが、同サービスのにじジャーニーはイラスト好きにはたまらないと思います。

  • MidjourneyはDavid HolzとDaniel Jeffriesによって設立された研究所のAI。
  • 自然言語のプロンプトを入力することで、ユーザーの想像力に基づいた美しいビジュアルアートを生成できる。
  • ユーザーはDiscordのチャットインターフェースを通じてMidjourneyと対話できる。

https://www.midjourney.com/

にじジャーニー

https://nijijourney.com/ja/

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次