發表文章

目前顯示的是 7月, 2025的文章

使用python撈取檔案清單

  以下是AI提供python代碼撈取檔案清單,在撈取整個硬碟時如D槽,輸入方式不一樣,需要以D:\\呈現,相關解答也是由AI提供,在除錯方面相當即時。 AI講解錯誤的原因: 在字串的結尾 \" 被 Python 當作是 逃逸字元(escaped quote) ,導致 字串結尾的引號無法正確解析 ,造成語法錯誤(SyntaxError: unterminated string literal)。 撈取檔案清單的代碼:(撈取36萬筆清單大概5分鐘以內) import os import pandas as pd from datetime import datetime # 掃描的來源資料夾(可修改) scan_dir = r"D:\\" # 存檔的目的資料夾(可修改) save_dir = r"C:\資料" # 取得來源資料夾的最後一層名稱(作為檔名的一部分) last_folder_name = os.path.basename(os.path.normpath(scan_dir)) # 儲存檔案資訊 file_data = [] # 遍歷所有子資料夾與檔案 for foldername, subfolders, filenames in os.walk(scan_dir):     for filename in filenames:         filepath = os.path.join(foldername, filename)         try:             stat = os.stat(filepath)             file_info = {                 "檔名": filename,                 "路徑": filepath,         ...

將含有數據的條列訊息丟給不同AI處理_結果gpt險勝

今天將100多列的訊息分別丟給chatgpt、gemini、grok、claude處理,讓他們針對每一個敘述分類並將數據以另外一欄列出。 gemini無法生成excel grok無法分欄顯示(全擠在一欄用,分開) calude在產生過程中算是這幾個中分類最好,抓取的數據也是最符合我要的,但在下載時無法下載(白搭) chatgpt分類的方式不是最好,而且會有掉訊息的情況,同樣的內容只有gpt會這樣,詢問gpt提出要以txt檔作為來源訊息,以txt提供後,沒有掉訊息的情形發生。 以下是詢問GPT為什麼會需要txt檔做為來源訊息的回覆。 這是個非常好的問題,原因可以從 記憶體限制(token 限制) 和 格式辨識效率 兩個面向來解釋: ✅ 一、記憶體限制(token 限制) 每次你和 GPT 對話時,整段輸入(包括你的提問和我們的回應)都會消耗「token」(類似字元數)。目前 GPT-4o 雖然上限很高(約 128,000 tokens),但仍有以下幾個問題: 每段資料會累加消耗記憶體 :例如你貼入 100 多筆條列訊息,每筆都可能是幾十個 token,加總起來可能就超過幾萬 token,很快接近或超出模型記憶容量。 超過記憶範圍時會導致無法完整理解或漏讀內容 :模型可能忽略尾段、遺漏細節,或無法正確抓取所有結構。 ✅ 二、文字格式(text file)處理更穩定 使用純文字檔的原因: 結構清楚、格式一致 :貼在對話框中的條列訊息常因排版(如縮排、符號、斷行)不一致,造成辨識混亂。 易於批次讀取與轉換表格 :文字檔能夠讓模型視為一個整體資料集合,用來進行結構分析、提取欄位、分類等動作會更準確、效率更高。 ✅ 三、補充:為什麼會突然「需要文字檔」? 並非 GPT「只能」處理文字檔,而是當條列數量過多時: 貼在對話框中的資料會「變得難以解析」或「容易遺漏資訊」 用文字檔可以 直接導入成檔案處理模式 ,提高正確率並保留完整內容 特別是在你需要「整理成表格」、「分類」或「導出 Excel」這種結構化任務時,提供 .txt 會幫助我們更精準處理每一項資料 ✅ 總結 原因 說明 記憶體限制 條列數量一多,很快耗盡 token 配額,導致處理不全 結構清晰性 對話框排版不一,文字檔格式更清楚、易讀取 ...

雲端平台 Python 與地端(本機)Python 主要差異

今天請AI幫忙寫爬蟲程式,但資料未下載到資料夾中,後來才發現使用雲端python與地端python會有差異,原本地端可以運行的程式在雲端要執行同樣效果則須作些許修改。不過在家裡,目前還是會以雲端python執行,雖然在公司無法使用雲端python,但以快速及使用者介面,雲端python還是較令人感到舒適。 以下為AI解釋雲端平台 Python 與地端(本機)Python 差異: 雲端平台 Python 與地端(本機)Python 主要差異在於 運行環境、資源存取、安全性與使用情境 等。以下以表格與說明進行比較: 📊 差異比較表 項目 雲端平台 Python 地端(本機)Python 運行環境 遠端伺服器(如 Google Colab, AWS, Azure, GCP 等) 安裝在本機電腦 計算資源 可使用 GPU/TPU、高階 CPU(通常需付費) 受限於本機硬體效能 環境管理 已安裝大部分常用套件,免安裝或用 pip 安裝即可 需自行建立虛擬環境、安裝套件 檔案存取 存取雲端硬碟或需上傳/掛載資料(如 Google Drive) 可直接存取本機硬碟 網路限制 通常網路開放,但會有安全機制(像 Colab 限制下載目錄) 完全依照本機防火牆與網路設定 持久性 執行環境可能會重置、檔案不易保存 檔案永久保留(除非手動刪除) 安全性 雲端平台需授權存取雲端硬碟、API 等,資料可能需加密 較能掌控安全性與隱私風險 效能彈性 可依需求彈性擴充(如升級至 Colab Pro) 升級需更換或擴充硬體 操作介面 通常為 Jupyter Notebook(網頁介面) 可使用 Jupyter、VS Code、PyCharm 等 適用情境 資源密集任務、合作開發、快速原型設計 資料保密性高、需本機存取、長期開發 💡 簡要說明 ✅ 雲端平台適合: 使用者沒有強大硬體但需要跑 AI 模型或大量運算。 學術研究、教學、團隊共享專案(如使用 Google Colab)。 開發階段、快速測試各種函式與套件。 ✅ 地端 Python 適合: 資料存放於本機,或需進行大量本地檔案操作。 工作環境有嚴格的資訊安全規範。 長期開發、部署自有應用程式(如自動化腳本、桌面應用)。 如果你目前使用 Colab 執行 Python 程式,但發現...