因为要做英文文献索引分词,所以对于索引词汇必须得是英文,将表中的中文都转换成英文
这里用到百度的翻译API
首先需要注册成为百度翻译开发者:百度翻译开放平台
注册成为个人开发者就可以,
这里可以完善相关信息,要记住的包括APPID和密钥,这里最好不要填服务器地址,不然会报错
这里可以查看到具体请求的细节
具体代码如下:
public class test {
public static void main(String[] args) {
try {
String apiKey = "xxxxxxxxxx";
String sourceText = "4-羟基-3-甲氧基苯基 O-β-D-吡喃葡萄糖基-(1→6)-O-β-D-吡喃葡萄糖基-(1→6)-β-D-吡喃葡萄糖苷";
String appId="xxxxxxx";
String encodedText = URLEncoder.encode(sourceText, "UTF-8");
String url = "http://api.fanyi.baidu.com/api/trans/vip/translate?q="+encodedText+"&from=zh&to=en&appid=" + appId + "&salt=1435660288&sign=" + md5(appId + sourceText + "1435660288" + apiKey);
HttpClient client = HttpClientBuilder.create().build();
HttpGet request = new HttpGet(url);
HttpResponse response = client.execute(request);
BufferedReader reader = new BufferedReader(new InputStreamReader(response.getEntity().getContent()));
StringBuilder result = new StringBuilder();
String line;
while ((line = reader.readLine()) != null) {
result.append(line);
}
System.out.println(result.toString());
JSONObject jsonObject = JSONObject.parseObject(result.toString());
JSONArray transResultArray = jsonObject.getJSONArray("trans_result");
JSONObject jsonObject1 = transResultArray.getJSONObject(0);
String dst = jsonObject1.getString("dst");
System.out.println(dst);
} catch (Exception e) {
e.printStackTrace();
}
}
private static String md5(String input) {
return DigestUtils.md5Hex(input);
}
}
其中有好几处细节需要注意,需要替换为自己的appid和密钥、拼接url的时候,前半部分需要将输入的转换为UTF-8格式,不然会因为莫名其妙的符号报错,后半部分则保持原样输入,from=zh&to=en
表明了是中文转英文,其他语言可以在开发文档中找到,后面通过json解析和转换,最终获取到英文结果。
对于输入的“4-羟基-3-甲氧基苯基 O-β-D-吡喃葡萄糖基-(1→6)-O-β-D-吡喃葡萄糖基-(1→6)-β-D-吡喃葡萄糖苷”,可以看到转成英文的结果: