📝📝:堪稱博士生等級的 OpenAI o1 將會稱霸 AI 市場?|經過實測發現:o1 像理科生、4o 像文科生

1 / 1

大家引頸期盼 o1、4o 哪個比較好用?我分幾個面向測試了兩個不同的模型,製作了一個簡單的表格,在四個不同領域的表現,分別是:

  • 詩詞翻譯
  • 哲學申論
  • 活動企劃
  • 數學計算。

總結來說,各有優劣。

o1 確實如官方所說,更擅長推理以及計算,是個妥妥的理科生。

而 4o 在翻譯以及文字表述的產出較為擅長,生成的回應也較回口語且人性化,相當於一個文科生。

因此,需要看使用的需求,再決定哪個模型較能勝任,並沒有哪個是絕對的好。

詩詞翻譯|翻譯美國詩人愛倫坡的 A Dream Within a Dream

  • o1:較為呆板,輸出後的詩詞格式以及斷句會跑掉。
  • 4o:更為靈活,輸出後保留原來的詩詞格式及斷句。

▲愛倫.坡(Edgar Allan Poe),美國作家、詩人、編輯與文學評論家。

《夢中之夢》(A Dream Within a Dream)是愛倫坡的一首著名詩。詩中捕捉了時間的轉瞬即逝,以及現實和夢想的難以捉摸的本質。原文完整詩詞如下,中文翻譯過後的詩詞可以點選 連結收看

Take this kiss upon the brow!
And, in parting from you now,
Thus much let me avow —
You are not wrong, who deem
That my days have been a dream;
Yet if hope has flown away
In a night, or in a day,
In a vision, or in none,
Is it therefore the lessgone? 
Allthat we see or seem
Is but a dream within a dream.

I stand amid the roar
Of a surf-tormented shore,
And I hold within my hand
Grains of the golden sand —
How few! yet how they creep
Through my fingers to the deep,
While I weep — while I weep!
O God! Can I not grasp
Them with a tighter clasp?
O God! can I not save
Onefrom the pitiless wave?
Isallthat we see or seem
But a dream within a dream?  

我是廣告,請往下繼續閱讀

哲學申論|解釋以及應用哲學家柏拉圖提出的《洞穴預言》

  • o1:字數相對少(781字),但結構還算完整,內容皆以簡體中文的用法回應(如:數字化、信息、渠道)。
  • 4o:字數相對多(1352字),結構更完整,內容多以繁體中文的用法回應。偶有簡體中文。

洞穴寓言也稱洞喻,是古希臘哲學家柏拉圖(Plato)在其著作《理想國》中提出的一個寓言故事,用來比較「教育和缺乏教育對我們本性的影響」。

洞喻來源於柏拉圖的哥哥格勞孔與其老師蘇格拉底之間的對話,並由後者記述。洞喻在日喻和線喻後提出。

在洞喻中,柏拉圖描述了一群人,他們一生都被鎖鏈拴在洞穴的牆壁旁,面對著一堵空白的牆壁。

活動企劃|策劃一檔 200 人的路跑活動並向運動品牌提案

  • o1:企劃書完整,包含流程、需求清單、合作方式、風險控管等,更讓人驚豔的是,o1 考慮到路跑活動的風險,並增加醫療設備需求。
  • 4o:企劃書較為簡略,僅專注於正面預期效益,未考慮戶外活動的潛在風險(如:跑者受傷)。

▲策畫路跑活動一定會遇到跑者受傷的風險。Photo by Capstone Events on Unsplash

數學計算|以 113 年國中教育會考數學科第六題作為題目

  • o1:答對且步驟完整,詳細解釋題目(前提、方向)的每個步驟,很像坊間看到的大考題目詳解。
  • 4o:令人驚訝的是 4o 也答對了,但答題過程不如 o1 完整。我猜測思維鍊的技術應該也有應用到 4o 上了。

▲Photo by Antoine Dautry on Unsplash