計算機, 文件類型
CSV格式,或把逗號?
在這些應用中,如果遇到不是一個程序員,這已經是高級用戶,進口數據從一個應用程序到另一個不會很少發生。 而且經常有必要導入表格數據,其中,其實是由CSV格式創造。 誰開發了幾個備選解決方案(其中包括XML的領導者)。 但CSV文件的創建,在某些情況下,是最方便的解決方案,以及一些 - 最有問題的。
它代表的格式為commaseparatedvalues的名字 - 逗號分隔值。 在記事本文件,如下所示:
00,01,02,03;
01,15,34,11;
16,27,33,06(在一個符號的末尾放置不是必需的)
而在Excel電子表格或類似的應用程序已經如此:
| 00 | 01 | 02 | 03 |
| 01 | 15 | 34 | 11 |
| 16 | 27 | 33 | 06 |
但是,我們現在討論最簡單的情況。 問題開始只是因為,由於非常壓縮的數據報告,CSV格式是用來傳輸大量信息的事實。 大多數情況下在不同價值觀的數據庫中發現:數字,字母,字母數字,用空格等。 經常在大型陣列是錯誤的,如果,例如,某個地方將是其中的一個字段的內容的額外的逗號,所有單元可以通過一個被移位。
一般地,產生的問題當數據經由導入 文件格式 CSV,可以分為三大類:
1 - 不正確的填充字段。
2 - 保存到CSV文件時不正確的數據轉換。
3 - 不正確的識別程序格式進口商。
第一種情況,我們已經部分檢查。 為了解決這一問題,必須提供監視輸入的數據的正確性的一種手段。 例如,如果你需要收集郵件列表地址的數據庫,有專門的腳本,檢驗一個人是否已進入電子郵件以正確的格式。 凡有差距,逗號和可讀取錯誤的任何其他數據,該字段的內容必須用引號(所謂的電腦“”)。
第二種情況與編碼的選擇連接。 需要找出往往是由什麼編碼導入偏愛程序遇到。 在Windows中常用的1251,所以如果原始文件將滿足文本為Unicode,遵循它會在目標應用程序的問題一個鏈來顯示。 在Excel中,您可以在CSV格式保存不同的編碼和分隔符(除使用選項卡,分號還是點),但它是最好創建一個記事本文件++或OpenOfficeCalc。
第三種情況 - 第二的結果。 從歷史上看,CSV格式沒有一個標準。 許多程序被視為CSV和TSV文件(製表符分隔),並SCSV(用分號隔開),特別是因為文件擴展名不報了。 在這種情況下,數據被錯誤地讀取並以正確的順序的細胞中,沒有分配。 我們可以建議最好的事情 - 要親自創建一個CSV文件。 前面已經提到,它需要採取一個方便的編輯器的優勢。
技巧如何馴服CSV格式,稱為程序員。 簡單的用戶需要堅持我們的建議創建一個文件。 至少的所有問題是為導入(以不同的方式和有時)專門創建當文件到一個特定的應用程序中發生。 它更容易考慮所有的可能遇到的問題 的數據。
Similar articles
Trending Now