Explorar o código

feat: 添加人名处理函数

许家凯 %!s(int64=4) %!d(string=hai) anos
pai
achega
47a0709bab
Modificáronse 1 ficheiros con 20 adicións e 0 borrados
  1. 20 0
      src/main/java/com/winhc/bigdata/udf/NameCleanup.java

+ 20 - 0
src/main/java/com/winhc/bigdata/udf/NameCleanup.java

@@ -0,0 +1,20 @@
+package com.winhc.bigdata.udf;
+
+import com.aliyun.odps.udf.UDF;
+import com.aliyun.odps.utils.StringUtils;
+
+import javax.xml.soap.Name;
+import java.util.regex.Pattern;
+
+/**
+ * @Author: XuJiakai
+ * @Date: 2020/5/14 16:26
+ * @Description: 字符串去符号
+ */
+public class NameCleanup extends UDF {
+    private static final Pattern pattern = Pattern.compile("[^\\u4e00-\\u9fa50-9a-zA-Z()() ·]");
+
+    public String evaluate(String val) {
+        return StringUtils.isNotBlank(val) ? pattern.matcher(val).replaceAll("").replaceAll(" +", " ") : "";
+    }
+}