汉字拼音转换工具_Python版

标签: NLP  Python

描述:
小亮今天看到一篇不错的项目,现在和大家分享一下哈!该项目是基于hotoo/pinyin开发。将汉字转为拼音,可以用于汉字注音、排序、检索(Russian translation) 。详情请见下文!
环境配置:
Wn10+CPU i7-6700
Pycharm 2018
python 3.6
numpy 1.14.5
相关代码参考创始人的github 这里附上地址:https://github.com/mozillazg/python-pinyin
这里是小亮的blog地址:https://legendtianjin.github.io/NextLegend.github.io/
笔者信息:Next_Legend QQ:1219154092 机器学习 深度学习 模式识别 自然语言处理 计算机视觉
——2018.9.3于天津大学


一、github介绍

这里写图片描述

二、特性

(1) 根据词组智能匹配最正确的拼音。
(2) 支持多音字。
(3) 简单的繁体支持, 注音支持。
(4) 支持多种不同拼音/注音风格。

三、安装

注意:以下两种安装方式选择其一即可
1、pip安装

$ pip install pypinyin

2、pycharm安装
这里写图片描述
这里写图片描述

四、代码实践


#coding:utf-8
from pypinyin import pinyin, lazy_pinyin, Style

value1 = pinyin('天津大学')
print(value1)

value2 = pinyin('天津大学', heteronym=True)  # 启用多音字模式
print(value2)

value3 =  pinyin('天津大学', style=Style.FIRST_LETTER)  # 设置拼音风格
print(value3)

value4 = pinyin('天津大学', style=Style.TONE2, heteronym=True)
print(value4)

value5 = pinyin('天津大学', style=Style.BOPOMOFO)  # 注音风格
print(value5)

value6 = pinyin('天津大学', style=Style.CYRILLIC)  # 俄语字母风格
print(value6)

value7 = lazy_pinyin('天津大学')  # 不考虑多音字的情况
print(value7)

五、实验结果

[['tiān'], ['jīn'], ['dà'], ['xué']]
[['tiān'], ['jīn'], ['dà'], ['xué']]
[['t'], ['j'], ['d'], ['x']]
[['tia1n'], ['ji1n'], ['da4'], ['xue2']]
[['ㄊㄧㄢ'], ['ㄐㄧㄣ'], ['ㄉㄚˋ'], ['ㄒㄩㄝˊ']]
[['тянь1'], ['цзинь1'], ['да4'], ['сюэ2']]
['tian', 'jin', 'da', 'xue']

这里写图片描述

原文链接:加载失败,请重新获取