私が言うのは、あなたはAIグラフの違いを本当に知らないかもしれません
更新日: 28-0-0 0:0:0

現在、AI画像を区別するのは本当に難しくなっています。

数秒で、以下の4つの画像のうちどれがAIによって生成されたものかわかりますか?

最初に質問を行い、答えを覗くために下線を引かないでください!

実はここしかないんです左下本物の写真です。 あなたがそれを正しく推測したかどうかはわかりませんが、とにかく、編集部の友人たちはそれが非常に難しいと考えています。

このままでは、AI画像の本物と偽物の区別がつきにくくなり、多くのAI検出ツールでさえ失敗しています。

このように言えば、以前に生成された写真の中には、コミックスタイル、奇妙な手足や顔の特徴、理不尽な背景など、要するに抜け穴だらけで、時にはかなり怖いものがあります。

しかし、少し前にGPT-4oがアップグレードされるとすぐに、大型モデルの文生マップ能力は直接的に素晴らしかったです。 たとえば、右上隅の「selfie」は、次のプロンプトワードによって生成されます。

大規模なモデルは、「平凡」、「不注意」、「あいまいさ」、「露出オーバー」などの抽象的な要件も理解できますその結果、私たちの生活の中で何気ない写真が撮られたようなもので、不服従の感覚は全くありません。

具体的には、これらのモデルがAIグラフィックスを本物と偽物に見せる方法、公式はまだ彼らのトレーニングアーキテクチャをオープンソース化していません。

しかし、OpenAIの公式サイトでは、いくつかの手がかりを見つけました。

当局は、モデルをトレーニングすると、モデルが言語と画像の関連性をよりよく理解できるようになると述べています。 謎めいた「ポストトレーニング」と相まって、生成された結果は滑らかに見えます。

したがって、「不注意」などの抽象的な言葉を出すと、モデルは画像の角度が少し曲がっている必要がある、画像は少しどろどろしている必要がある、表現は自然である必要があるなどを知ることができ、完全に表示できます。

テクノロジーの急速な発展により、炭素ベースの生物については本当に何もできません。

しかし、さらに絶望的なのは、実験結果が、今回はシリコンベースも区別がつかないことを示していることです。

まず、大型モデルの槍が自分の盾を突破できるかどうか試してみました。 当然のことながら、私たちのような偽のAI画像の原型は簡単に見分けることができます。 しかし、今、同じ写真をDoubaoとGPTに投げると、彼らは両方ともそれが本当の自撮り写真だと思っています。

ビーンバオは、この画像がAIによって生成されたものであることを知ることができません

大規模なモデルでのテストに加えて、最高ランクを推奨する2つの無料のAI画像検出器も見つかりました。その結果、それぞれが独自の方法で崩壊しました。

肉眼では全く見えない8枚のAIポートレート画像をテストしました。 彼らが同意する4つの写真がありますが、それらはすべて実際の写真であることに同意します...

さらに4つあり、2つの検出器の意見は完全に反対です。 お互いの宿題をコピーしていると思っていましたが、今回は間違った問題がすべて異なるため、今ではそれを疑っていません。

要するに、それはただそれをするだけのものです

これは比較的単純なポートレートであり、写真は人物の正面に焦点を合わせており、背景は比較的シンプルです。

いくつかの複雑なシーンの次のテストはさらに悲惨で、多数の人物や詳細すぎる背景、さらには単純な風景写真でさえ、検出器をほぼ完全に全滅させます。 検出器がAIの自撮り写真に少し懐疑的であっても、これらの画像に関しては本当に彼らを信じています。

ただ認識できないだけで、誤って怪我をしてしまい、本物の写真をAI画像と判定した検出器があります。

言うべきことが1つあり、オンライン愛好家の空が落ちてしまい、それが写真なのか写真なのか、将来的には本当にわかりません。P写真は痕跡を残すかもしれませんが、現在のAI写真は、これが私に恋をするインターネットの有名人ではないのではないかと人々に本当に思わせます。

では、なぜAI検出ツールが今機能していないのでしょうか?

検索すると、Wenshengグラフ技術の開発はロケットに乗るようなものですが、AI画像検出は長年にわたって畳み込みニューラルネットワーク自転車に乗っていることがわかりました。

ほとんどのツールはソースコードをオープンソース化していないため、GitHubでいくつかのAI画像検出プロジェクトが参照として見つけられました。

これらのAI検出ツールのアーキテクチャは、まだデータセット+畳み込み特徴認識+分類の段階にあることがわかりました。

コンピュータビジョンに精通している人は、このプロセスがN年間続いてきたことを知っているかもしれません:最初にデータセット内の各画像にAI生成であるかどうかをラベル付けし、ニューラルネットワークはラベルの対応する画像特徴を学習し、最後にそれを分類します。

AIマッピング技術は次々と更新されており、これらのツールが行うのは、新しいAIグラフにラベルを付け、古いデータセットに追加し、再学習することだけです。ツールの1つのCvT-4モデルでさえ、0年前の古いものです。

魔法は1フィートの高さ、道路は1インチの高さ、技術自体は更新されておらず、精度は確かに上がることができないと言えます。

CvT-13 アーキテクチャ

AI画像認識に関連する学術研究はいくつかありますが、研究の速度、量、注意力は、大規模なモデルの文生図とは比較になりません。

しかし、分離後に手間がかかるのではなく、問題を根源から解決する方が良いでしょう。

例えば、大手AI企業が共同で提唱しているC2PAという組織では、情報源の検証を容易にし、AIコンテンツの拡散を防ぐための関連規格の策定を促しています。

その中で、OpenAIは、生成された画像に透かしを入れようとすると述べています。 Googleは、AIが生成したテキスト、画像、ビデオ、およびオーディオにデジタル透かしを埋め込むことができるsynthIDも提案しています。 この透かしは私たちの知覚に影響を与えませんが、ソフトウェアによって認識することができます。

さらに、今年19月に州が公布した「人工知能生成合成コンテンツの特定に関する措置」では、0から0まで、すべてのAI生成コンテンツを明示的または暗黙的にマークする必要があると明確に述べられています。

では、なぜAIグラフを区別する必要があるのでしょうか。 テクニカルパワーMAXの違いがわからないのは良いことではないでしょうか?

この絵は本当に強力ですが、私たちはすべての両面を見なければなりません。なぜなら、AIの画像が世界に衝撃を与えたとき、AIを使って詐欺や犯罪を犯したというニュースはまだ頻繁に暴露されていたからです。 AIが現実的であればあるほど、詐欺に遭う可能性が高くなります。

結局のところ、AIを使ってジブリ風のかわいい画像を生成する方法を考えず、最もリアルな画像を使ってみんなの弱点を攻撃する人もいます。

一般的に、現在、私たち自身で本物と偽のAI画像を区別することは困難です。

ツールの特定にせよ、ソースにAIコンテンツにタグを付けるにせよ、現在のテクノロジーは少し遅れていますが、その必要性は緊急です。

このように、AIコンテンツの差別化は絶え間ない戦いになります。 大手企業がスケッチ技術に取り組み、筋肉を見せつけているとき、AI認識技術のアップグレードを検討する時期に来ています。