Introduction
流程
我們欲使用的數據可能存在不同的文件中,因此API會進行以下操作
- 構造一個欲讀取文件的隊列
- 文件隊列中包含路徑+文件名
- 可亂序置入隊列中也可順序置入
- 讀取(read)隊列文件的內容
- 預設讀取時,只讀取一個樣本
- 讀取的文件格式不一樣,所使用的API也不一樣
- 文件格式:
- csv文件:讀取一行數據
- 二進制文件(binary):指定一個樣本的bytes讀取
- 圖片文件(jpeg,png…):一張一張的讀取
解碼(decode)
- 讀取時只返回一個樣本的結果,因此也只解碼一個樣本的內容
批處理
- 構造一隊列
- 將解碼後的文件放入隊列中(A文件A1樣本,A文件A2樣本……)
訓練模型
- 主線程拿取批處理隊列的樣本,進行訓練
- 手動開啟線程
- 前面四步則由子線程完成
- 主線程拿取批處理隊列的樣本,進行訓練
tips
- 前面提到的隊列,隊列管理器,線程協調器皆有完整的固定API已經封裝好直接調用,不需在自己定義