2025年7月15日 星期二

將含有數據的條列訊息丟給不同AI處理_結果gpt險勝

今天將100多列的訊息分別丟給chatgpt、gemini、grok、claude處理,讓他們針對每一個敘述分類並將數據以另外一欄列出。

  • gemini無法生成excel
  • grok無法分欄顯示(全擠在一欄用,分開)
  • calude在產生過程中算是這幾個中分類最好,抓取的數據也是最符合我要的,但在下載時無法下載(白搭)
  • chatgpt分類的方式不是最好,而且會有掉訊息的情況,同樣的內容只有gpt會這樣,詢問gpt提出要以txt檔作為來源訊息,以txt提供後,沒有掉訊息的情形發生。



以下是詢問GPT為什麼會需要txt檔做為來源訊息的回覆。


這是個非常好的問題,原因可以從 記憶體限制(token 限制)格式辨識效率 兩個面向來解釋:


✅ 一、記憶體限制(token 限制)

每次你和 GPT 對話時,整段輸入(包括你的提問和我們的回應)都會消耗「token」(類似字元數)。目前 GPT-4o 雖然上限很高(約 128,000 tokens),但仍有以下幾個問題:

  1. 每段資料會累加消耗記憶體:例如你貼入 100 多筆條列訊息,每筆都可能是幾十個 token,加總起來可能就超過幾萬 token,很快接近或超出模型記憶容量。

  2. 超過記憶範圍時會導致無法完整理解或漏讀內容:模型可能忽略尾段、遺漏細節,或無法正確抓取所有結構。


✅ 二、文字格式(text file)處理更穩定

使用純文字檔的原因:

  1. 結構清楚、格式一致:貼在對話框中的條列訊息常因排版(如縮排、符號、斷行)不一致,造成辨識混亂。

  2. 易於批次讀取與轉換表格:文字檔能夠讓模型視為一個整體資料集合,用來進行結構分析、提取欄位、分類等動作會更準確、效率更高。


✅ 三、補充:為什麼會突然「需要文字檔」?

並非 GPT「只能」處理文字檔,而是當條列數量過多時:

  • 貼在對話框中的資料會「變得難以解析」或「容易遺漏資訊」

  • 用文字檔可以直接導入成檔案處理模式,提高正確率並保留完整內容

  • 特別是在你需要「整理成表格」、「分類」或「導出 Excel」這種結構化任務時,提供 .txt 會幫助我們更精準處理每一項資料


✅ 總結

原因說明
記憶體限制條列數量一多,很快耗盡 token 配額,導致處理不全
結構清晰性對話框排版不一,文字檔格式更清楚、易讀取
處理效率大量資料需要一次讀入與解析,使用檔案最穩定
可擴充性後續若需分類、轉換格式、匯出 Excel,文字檔利於自動處理

沒有留言:

張貼留言

使用python撈取檔案清單

  以下是AI提供python代碼撈取檔案清單,在撈取整個硬碟時如D槽,輸入方式不一樣,需要以D:\\呈現,相關解答也是由AI提供,在除錯方面相當即時。 AI講解錯誤的原因: 在字串的結尾 \" 被 Python 當作是 逃逸字元(escaped quote) ,導致...