本篇文章主要介紹了解決linux下linux文件解壓linux,具有一定的參考價值,感興趣的小伙伴們可以參考一下。
原因
由于zip格式并沒有指定編碼格式,windows下生成的zip文件中的編碼是GBK/GB2312等,因此,導致這些zip文件在Linux下解壓時出現亂碼問題,因為Linux下的默認編碼是UTF8。
解決方案一
使用7z解壓。
linuxp7zip和convmv
#?fedora $?su?-c?'yum?install?p7zip?convmv' #?ubuntu $?sudo?apt-get?install?p7zip?convmv
執行一下命令解壓縮
#?使用7z解壓縮 $?LANG=C?7za?x?your-zip-file.zip #?遞歸轉碼 $?convmv?-f?GBK?-t?utf8?--notest?-r?.
解決方案二
在windows上壓縮的文件,是以系統默認編碼中文來壓縮文件。由于zip文件中沒有聲明其編碼,所以linux上的unzip一般以默認編碼解壓,中文文件名會出現亂碼。
雖然2005年就有人把這報告為bug, 但是info-zip的官方網站沒有把自動識別編碼列入計劃,可能他們不認為這是個問題。Sun對java中存在N年的zip編碼問題,采用了同樣的處理方式。
有2種方式解決問題:
1. 通過unzip行命令解壓,指定linux
unzip -O CP936 xxx.zip (用GBK, GB18030也可以)
有趣的是unzip的manual中并無這個選項的說明, unzip –help對這個參數有一行簡單的說明。
2. 在環境linux中,指定unzip參數,總是以指定的字符集顯示和解壓文件
/etc/environment中加入2行
UNZIP="-O?CP936" ZIPINFO="-O?CP936"
這樣Gnome桌面的歸檔文件管理器(file-roller)可以正常使用unzip解壓中文,但是file-roller本身并不能設置編碼傳遞給unzip。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
THE END