Linux下文件字符集编码转变

发布时间:2019-09-08  栏目:LINUX  评论:0 Comments

Linux下文件字符集编码转变

  1. 安装转变工具

 

[[email protected]
/]# yum install convmv

查阅文件编码file命令

  1. 翻开Linux的字符集

file ip.txt

[[email protected]
/]# locale

查阅文件编码file命令

LANG=zh_CN.utf8

file ip.txt

LC_CTYPE=”zh_CN.utf8″

ip.txt: UTF-8 Unicode text, with escape sequences

LC_NUMERIC=”zh_CN.utf8″

一、利用iconv命令实行编码转变文件内容编码转变

LC_TIME=”zh_CN.utf8″

iconv命令用于转移钦命文件的编码,暗许输出到专门的学问输出设备,亦可钦点输出文件。

LC_COLLATE=”zh_CN.utf8″

用法: iconv [选项…] [文件…]

LC_MONETARY=”zh_CN.utf8″

有如下选项可用:

LC_MESSAGES=”zh_CN.utf8″

输入/输出格式规范:

LC_PAPER=”zh_CN.utf8″

-f, –from-code=名称 原始文本编码

LC_NAME=”zh_CN.utf8″

-t, –to-code=名称 输出编码

LC_ADDRESS=”zh_CN.utf8″

  www.2cto.com  

LC_TELEPHONE=”zh_CN.utf8″

信息:

LC_MEASUREMENT=”zh_CN.utf8″

-l, –list 列举全数已知的字符集

LC_IDENTIFICATION=”zh_CN.utf8″

出口调节:

LC_ALL=

-c 从出口中忽视无效的字符

  1. 千帆竞发转移

-o, –output=FILE 输出文件

[[email protected]
/]# convmv –notest –nosmart-f utf8-t gb2312-r test

-s, –silent 关闭警告

解释:

–verbose 打字与印刷进度音信

test 转变的目录

-?, –help 给出该体系求助列表

-r 管理子文件夹

–usage 给出简要的用法消息

utf8 —在此以前的编码

-V, –version 打字与印刷程序版本号

gb2312—之后的编码

例子:

注明:本地的字符集为zh_CN.utf8拷贝到windows是乱码所以要中间转播成gb2312编码

iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt

输入/输出格式标准:
-f, –from-code=名称 原始文本编码
-t, –to-code=名称 输出编码

这一个命令读取aaa.txt文件,从utf-8编码转变为gb2312编码,其出口定向到bbb.txt文件。

信息:
-l, –list 列举全部已知的字符集
例子:
iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt
本条命令读取aaa.txt文件,从utf-8编码调换为gb2312编码,其出口定向到bbb.txt文件。
翻看文件命令首要有须臾间多少个:

 

cat命令功能用于显示整个文件的内容单独使用没有翻页功能因此经常和more命令搭配使用,cat命令还有就是将数个文件合并成一个文件的功能。more命令功能:让画面在显示满一页时暂停,此时可按空格健继续显示下一个画面,或按Q键停止显示。less命令功能:less命令的用法与more命令类似,也可以用来浏览超过一页的文件。所不同的是less命令除了可以按空格键向下显示文件外,还可以利用上下键来卷动文件。当要结束浏览时,只要在less命令的提示符“:”下按Q键即可。其实这三个命令除了cat命令有合并文件的功能,其余功能上相近,只是从浏览习惯和显示方式上有所不同

查看文件编码file命令file test.sqltest.sql: UTF-8 Unicode text, with escape sequences功能说明:辨识文件类型。语  法:file [-beLvz][-f <名称文件>][-m <魔法数字文件>...][文件或目录...]补充说明:通过file指令,我们得以辨识该文件的类型。参  数: -b  列出辨识结果时,不显示文件名称。 -c  详细显示指令执行过程,便于排错或分析程序执行的情形。 -f<名称文件>  指定名称文件,其内容有一个或多个文件名称呢感,让file依序辨识这些文件,格式为每列一个文件名称。 -L  直接显示符号连接所指向的文件的类别。 -m<魔法数字文件>  指定魔法数字文件。 -v  显示版本信息。 -z  尝试去解读压缩文件的内容。一、利用iconv命令进行编码转换文件内容编码转换  iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件.  用法: iconv [选项...] [文件...]  有如下选项可用:  输入/输出格式规范:  -f, --from-code=名称 原始文本编码  -t, --to-code=名称 输出编码  信息:  -l, --list 列举所有已知的字符集  输出控制:  -c 从输出中忽略无效的字符  -o, --output=FILE 输出文件  -s, --silent 关闭警告  --verbose 打印进度信息  -?, --help 给出该系统求助列表  --usage 给出简要的用法信息  -V, --version 打印程序版本号  例子:  iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt  这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件.  二、文件名编码转换  现在用linux,原来在windows里的文件都是用GBK编码的.copy到linux下是乱码,文件内容可以用iconv来转换可是好多中文的文件名还是乱码,找到个可以转换文件名编码的命令,就是convmv.  convmv命令详细参数  例如  convmv -f GBK -t UTF-8 *.mp3  不过这个命令不会直正的转换,你可以看到转换前后的对比.如果要直正的转换要加上参数 --notest  convmv -f GBK -t UTF-8 --notest *.mp3  -f 参数是指出转换前的编码,-t 是转换后的编码.这个千万不要弄错了.不然可能还是乱码哦.还有一个参数很有用.就是 -r 这个表示递归转换当前目录下的所有子目录.

二、文件名编码调换

http://www.bkjia.com/Linuxjc/772791.htmlwww.bkjia.comtruehttp://www.bkjia.com/Linuxjc/772791.htmlTechArticle1. 安装调换工具
[[email protected]
/]# yum install convmv 2. 查看Linux的字符集
[[email protected]
/]# locale LANG=zh_CN.utf8 LC_CTYPE=”zh_CN.utf8″
LC_NUMERIC=”zh_CN.utf8″ LC_TIME=”…

因为未来用linux,原来在windows里的公文都以用GBK编码的。所以copy到linux下是乱码,文件内容能够用iconv来调换可是大多华语的文书名依旧乱码,找到个能够转换文件名编码的通令,便是convmv。

convmv命令详细参数

例如

convmv -f GBK -t UTF-8 *.mp3

只是那几个命令不会直正的转变,你能够看到转变前后的对待。假设要直正的转移要增多参数
–notest

convmv -f GBK -t UTF-8 –notest *.mp3

-f 参数是提议调换前的编码,-t
是退换后的编码。那个绝对不要弄错了。不然可能依旧乱码哦。还应该有贰个参数很有用。就是-r 那一个代表递归调换当前目录下的全体子目录。

三、更加好的傻瓜型命令行工具enca,它不光能智能的甄别文件的编码,何况还帮忙成批示后转载换。

  www.2cto.com  

1.安装

$sudo apt-get install enca

2.翻看当前文件编码

enca -L zh_CN ip.txt

Simplified Chinese National Standard; GB2312

Surrounded by/intermixed with non-text data

3.转换

指令格式如下

$enca -L 当前语言 -x 目的编码 文件名

诸如要把当前目录下的具备文件都转成utf-8

enca -L zh_CN -x utf-8 *

enca -L zh_CN file 检查文件的编码

enca -L zh_CN -x UTF-8 file 将文件编码转变为”UTF-8″编码

enca -L zh_CN -x UTF-8 < file1 > file2
如若不想覆盖原作件能够那样,很简短吗。

 

http://www.bkjia.com/Linuxjc/552243.htmlwww.bkjia.comtruehttp://www.bkjia.com/Linuxjc/552243.htmlTechArticleLinux下文件字符集编码转换 查看文件编码file命令
file ip.txt 查看文件编码file命令 file ip.txt ip.txt: UTF-8 Unicode text,
with escape sequences 一、利用…

留下评论

网站地图xml地图