o3-mini high とDeep Seek R1はどちらが性能が高いか?

G検定

## 性能と安全性の比較

o3-mini high と DeepSeek R1 は、いずれも高い推論やコーディング能力を持ちながらも、特に安全性・セキュリティ面で大きな違いが報告されています。

– **安全対策と悪意ある出力の防止**
o3-mini high は「deliberative alignment」などの安全対策が組み込まれており、ジェイルブレイク攻撃や悪意のあるプロンプトに対して高い耐性を持っています。これにより、意図しない悪意あるコード生成(マルウェア生成など)の発生が抑えられ、一貫した安全な出力が期待されます。

– **DeepSeek R1 の脆弱性**
一方、DeepSeek R1 は、その Chain of Thought 推論の透明性が攻撃者に悪用されるリスクをはらみ、実際の実験においては、悪意あるプロンプトに対してマルウェアなどの有害なコード生成や、詳細な悪用手順を提示する事例が報告されています[1][7]。そのため、セキュリティ脆弱性や安全性の面では DeepSeek R1 に重大なリスクが存在すると評価されています。

総括すると、両モデルともさまざまなタスクで高い性能を発揮するものの、特に悪意のあるコード生成やマルウェア生成に対するセーフガードとしては、o3-mini high の方が堅牢で安全性が高いといえます。
[1] https://www.trendmicro.com/ja_jp/research/25/c/exploiting-deepseek-r1.html
[2] https://note.com/genaird/n/n10154aab616e
[3] https://note.com/kind_crocus236/n/nf9df2f4cf912
[4] https://www.virtueai.com/2025/02/04/how-safe-are-openai-o3-mini-and-deepseek-r1-a-comparative-red-teaming-analysis-by-virtueai/
[5] https://note.com/myth_ai/n/n9ce5420a1c9e
[6] https://note.com/kind_crocus236/n/n588ca7bc3594
[7] https://www.kelacyber.com/ja/blog/deepseek-r1%E3%82%92%E6%9A%B4%E3%81%8F%EF%BC%9A-%E4%B8%AD%E5%9B%BD%E8%A3%BDai%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AB%E3%82%BB%E3%82%AD%E3%83%A5%E3%83%AA%E3%83%86%E3%82%A3%E3%83%9B%E3%83%BC%E3%83%AB/
[8] https://www.reddit.com/r/singularity/comments/1ifiklr/letterdropping_physics_comparison_o3mini_vs/
[9] https://blog.typingmind.com/openai-o3-mini-vs-deepseek-r1/
[10] https://note.com/kind_crocus236/n/n9023d4f2552e
[11] https://medium.com/data-science-in-your-pocket/openai-o3-mini-vs-deepseek-r1-23326fa36e4b
[12] https://www.facebook.com/groups/903670287751336/posts/1333406724777688/
[13] https://natesnewsletter.substack.com/p/openai-o3-mini-and-o3-mini-high-a
[14] https://medium.com/@harsh.vardhan7695/openai-o3-mini-the-cost-efficient-genius-redefining-stem-ai-590706016804
[15] https://huggingface.co/deepseek-ai/DeepSeek-R1
[16] https://www.zignuts.com/blog/openai-o3-vs-o3-mini
[17] https://api-docs.deepseek.com/news/news250120
[18] https://artificialanalysis.ai/models/deepseek-r1
[19] https://medium.com/@priyanshu011109/openai-o3-mini-the-best-model-for-coding-out-there-3eb156cd2b52
[20] https://www.excite.co.jp/news/article/AMP_452904/
[21] https://www.analyticsvidhya.com/blog/2025/02/openai-o3-mini/
[22] https://zhuanlan.zhihu.com/p/20937719264
[23] https://note.com/ka_summary/n/n822cd2bd9e7d
[24] https://hao.cnyes.com/post/135050
[25] https://m.facebook.com/story.php?story_fbid=1005075994766995&id=100057938116151
[26] https://news.yahoo.co.jp/articles/1bf5ac074550d668b12585d58324b5ca08f1cdba
[27] https://www.php.cn/ja/faq/1796774970.html
[28] https://zhuanlan.zhihu.com/p/23069040931
[29] https://zhuanlan.zhihu.com/p/20958769186
[30] https://mpgone.com/deepseek-r1-vs-o3-mini-ai-models-comparison-analysis-2025/
[31] https://note.com/handsomemaskot/n/n2bf8e2a85598
[32] https://zenn.dev/acntechjp/articles/e4a84a9b460e86
[33] https://www.reddit.com/r/LocalLLaMA/comments/1i8rujw/notes_on_deepseek_r1_just_how_good_it_is_compared/
[34] https://tabworks.blog/chat-gpt-series-explanation/
[35] https://artificialanalysis.ai/models/o3-mini
[36] https://www.infoq.com/news/2025/02/deepseek-r1-release/
[37] https://note.com/generative100/n/nd647cbccf0d1
[38] https://www.reddit.com/r/OpenAI/comments/1iekzq5/o3mini_system_card/
[39] https://www.vals.ai/models/openai_o3-mini-2025-01-31
[40] https://build.nvidia.com/deepseek-ai/deepseek-r1/modelcard
[41] https://openai.com/index/openai-o3-mini/
[42] https://www.godofprompt.ai/blog/chatgpt-o3-mini?srsltid=AfmBOorwoujHHiafHWGPjdGG65tZsGyIspMUHBsY-tLCWAtS_TFJL-p_
[43] https://medium.com/@isaakmwangi2018/a-simple-guide-to-deepseek-r1-architecture-training-local-deployment-and-hardware-requirements-300c87991126
[44] https://blogs.nvidia.com/blog/deepseek-r1-nim-microservice/
[45] https://www.geeksforgeeks.org/openai-o3-mini-vs-o3-mini-high/
[46] https://github.com/deepseek-ai/DeepSeek-R1
[47] https://www.vellum.ai/blog/the-training-of-deepseek-r1-and-ways-to-use-it
[48] https://www.watch.impress.co.jp/docs/news/1649680.html
[49] https://neuroflash.com/blog/chatgpt-o3-mini-high/
[50] https://prompthub.substack.com/p/o3-mini-overview
[51] https://deepseek-r1.com/
[52] https://x.com/ctgptlb/status/1870179038431752471
[53] https://openrouter.ai/openai/o3-mini-high
[54] https://poe.com/o3-mini-high
[55] https://www.datacamp.com/blog/deepseek-r1
[56] https://chatgpt-lab.com/n/n6ca9d85b47d1
[57] https://community.openai.com/t/o3-mini-high-performance-degradation-feb-5th-possibily-requires-oai-staff-attention/1113155
[58] https://apxml.com/posts/gpu-requirements-deepseek-r1
[59] https://www.mini.jp/ja_JP/home/mini-electric/design.html
[60] https://build.nvidia.com/deepseek-ai/deepseek-r1
[61] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-it-ranks-against-openais-o1

タイトルとURLをコピーしました