服务器之家:专注于服务器技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|VB|R语言|JavaScript|易语言|vb.net|

服务器之家 - 编程语言 - Java教程 - Java获取汉字对应的拼音(全拼或首字母)

Java获取汉字对应的拼音(全拼或首字母)

2020-07-27 14:10崴脚步花盐人 Java教程

这篇文章主要介绍了Java如何获取汉字对应的拼音(全拼或首字母),文中实现的方法是引用了pinyin4j-2.5.0.jar,然后给出了完整的示例代码,有需要的朋友可以参考借鉴,下面来一起看看吧。

Java 根据汉语字符串获得对应的拼音字符串或者拼音首字母字符串等操作,需要添加jar包:

引入pinyin4j-2.5.0.jar

代码实现:

java" id="highlighter_679088">
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
 /***
 * 汉字工具类
 * @author csharper
 * @since 2014.12.26
 *
 */
public class ChineseCharacterUtil {
 /***
 * 将汉字转成拼音(取首字母或全拼)
 * @param hanzi
 * @param full 是否全拼
 * @return
 */
 public static String convertHanzi2Pinyin(String hanzi,boolean full)
 {
 /***
 * ^[\u2E80-\u9FFF]+$ 匹配所有东亚区的语言
 * ^[\u4E00-\u9FFF]+$ 匹配简体和繁体
 * ^[\u4E00-\u9FA5]+$ 匹配简体
 */
 String regExp="^[\u4E00-\u9FFF]+$";
 StringBuffer sb=new StringBuffer();
 if(hanzi==null||"".equals(hanzi.trim()))
 {
 return "";
 }
 String pinyin="";
 for(int i=0;i<hanzi.length();i++)
 {
 char unit=hanzi.charAt(i);
 if(match(String.valueOf(unit),regExp))//是汉字,则转拼音
 {
 pinyin=convertSingleHanzi2Pinyin(unit);
 if(full)
 {
  sb.append(pinyin);
 }
 else
 {
  sb.append(pinyin.charAt(0));
 }
 }
 else
 {
 sb.append(unit);
 }
 }
 return sb.toString();
 }
 /***
 * 将单个汉字转成拼音
 * @param hanzi
 * @return
 */
 private static String convertSingleHanzi2Pinyin(char hanzi)
 {
 HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
 outputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
 String[] res;
 StringBuffer sb=new StringBuffer();
 try {
 res = PinyinHelper.toHanyuPinyinStringArray(hanzi,outputFormat);
 sb.append(res[0]);//对于多音字,只用第一个拼音
 } catch (Exception e) {
 e.printStackTrace();
 return "";
 }
 return sb.toString();
 }
 
 /***
 * @param str 源字符串
 * @param regex 正则表达式
 * @return 是否匹配
 */
 public static boolean match(String str,String regex)
 {
 Pattern pattern=Pattern.compile(regex);
 Matcher matcher=pattern.matcher(str);
 return matcher.find();
 }
 
 public static void main(String[] args) {
 System.out.println(convertHanzi2Pinyin("我是中国人123abc",true));
 }
}

运行结果:

(1)全拼:

woshizhongguoren123abc

(2)首字母:

wszgr123abc

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。

原文链接:http://www.cnblogs.com/javasharp/p/4186710.html

延伸 · 阅读

精彩推荐