70 次代碼提交 1caa50ff1f ... 4c01e8d9bd

作者 SHA1 備註 提交日期
  JimZhang 4c01e8d9bd Merge branch 'master' of http://139.224.213.4:3000/bigdata/UDF_Max 2 年之前
  JimZhang d87d02bc49 feat: add udf 2 年之前
  JimZhang 720123c4b6 feat: cleanup change info udf 3 年之前
  xufei 08f52b6a9d add udf 3 年之前
  xufei b4cd164df8 add udf 3 年之前
  许家凯 c81a31d40e feat: v7_tyc_company_compare 3 年之前
  许家凯 eeca233cb7 feat: amount_format 3 年之前
  xufei 76d51eab44 add udf 3 年之前
  xufei f2ca305b0b add udf 3 年之前
  xufei 272d573d49 add udf 3 年之前
  xufei 655b09a801 Merge remote-tracking branch 'origin/master' 3 年之前
  xufei 4276faf725 add udf 3 年之前
  xufei ba60a5b796 update 3 年之前
  许家凯 3eb88739dc feat: 添加查找繁体转简体异常问题 3 年之前
  xufei f903f5eb12 注册资本规整 3 年之前
  xufei f063ac3cb2 add udf 3 年之前
  许家凯 65a281eab1 feat: 添加注册资本格式化函数 3 年之前
  xufei 656cd385bb add udf 3 年之前
  xufei a54ecebc03 是否结案判断 3 年之前
  xufei 1fcd8ec891 udf add 3 年之前
  xufei d142c1d774 日期规整 3 年之前
  xufei 70bb4c7967 法人提取 3 年之前
  xufei 7c47868b84 注册资本修复 3 年之前
  xufei c614fad9d8 行业code转name 3 年之前
  许家凯 c0cf3f6dbf feat: add 3 年之前
  许家凯 6bc8605b24 feat: add 3 年之前
  xufei bc7128e507 兼容数值 3 年之前
  xufei 31a105193b url提取 3 年之前
  许家凯 cc0de7ac9b feat: add CompanyZxrRestrictPublishDate 3 年之前
  许家凯 8e92101c86 feat: add FieldsCompare 3 年之前
  xufei d681f21879 更新逻辑 3 年之前
  JimZhang dab2dd7c3e fix: 薪资转换优化特殊情况 3 年之前
  JimZhang d4475bdb2b feat: 薪资转换兼容更多情况 3 年之前
  JimZhang 4fc26d560d feat: 薪资转换 3 年之前
  xufei 081e319f2b 更新逻辑 3 年之前
  xufei d6df72c4c6 Merge remote-tracking branch 'origin/master' 3 年之前
  xufei 83d95e3210 更新逻辑 3 年之前
  xufei 7e542efc63 update 3 年之前
  xufei 5974bba2dc Merge remote-tracking branch 'origin/master' 3 年之前
  xufei d8e9b2799b 更新文书 3 年之前
  xufei f00fd9a773 add func 3 年之前
  xufei b749bbfc09 合并json 3 年之前
  许家凯 4f24d0b327 feat: add 3 年之前
  xufei ea9654db66 更新 3 年之前
  xufei 1f67fb532c 更新 3 年之前
  xufei db7b58a751 更新 3 年之前
  许家凯 f6138cb853 Merge remote-tracking branch 'origin/master' 3 年之前
  许家凯 94e3ab49c2 feat: add 3 年之前
  许家凯 6ba65c3092 feat: pom依赖排除其它包 4 年之前
  许家凯 123e64224a Merge remote-tracking branch 'origin/master' 4 年之前
  许家凯 b3fbe53244 feat: 添加依赖 4 年之前
  晏永年 2239c08589 concat_ws2 4 年之前
  xufei 8ea80cdd2b 添加函数 4 年之前
  许家凯 4b0345cb6e Merge remote-tracking branch 'origin/master' 4 年之前
  许家凯 bf41832bfd feat: 添加一系列函数 4 年之前
  许家凯 862942c7af Merge remote-tracking branch 'origin/master' 4 年之前
  许家凯 4a4fc0569c feat: 添加全角转半角函数 4 年之前
  xufei 1e3ffa72a7 udf更新 4 年之前
  xufei 36615f166c udf更新 4 年之前
  许家凯 d248596eec feat: 添加行业code函数 4 年之前
  许家凯 47a0709bab feat: 添加人名处理函数 4 年之前
  许家凯 8574333003 feat: 添加concat_cleanup函数 4 年之前
  许家凯 8bb16b840c feat: 添加身份证号提取、注册资本提取 4 年之前
  许家凯 83e6eb3f2e feat: 案号规整函数中文括号转英文 4 年之前
  许家凯 b64de49f0c Merge remote-tracking branch 'origin/master' 4 年之前
  许家凯 a87244ee81 feat: 添加案号规整函数 4 年之前
  许家凯 2b0136259b Merge branch 'master' of http://139.224.213.4:3000/bigdata/UDF_Max 4 年之前
  许家凯 329b2abbdc add company_split 4 年之前
  许家凯 b441632a77 添加币种提取udf 4 年之前
  许家凯 fab820d3ce init 4 年之前

+ 30 - 0
src/main/java/com/winhc/bigdata/udf/StringAnyContains.java

@@ -0,0 +1,30 @@
+package com.winhc.bigdata.udf;
+
+
+import com.aliyun.odps.udf.UDF;
+import org.apache.commons.lang.StringUtils;
+
+/**
+ * @author ZhangJi
+ * @since 2022-04-13 18:39
+ */
+public class StringAnyContains extends UDF {
+    public Boolean evaluate(String val,String... args) {
+        if(StringUtils.isEmpty(val))return false;
+        if(args==null||args.length==0) {
+            return false;
+        }
+        for(String arg:args) {
+            if(arg!=null&&val.contains(arg)) {
+                return true;
+            }
+        }
+        return false;
+    }
+
+    public static void main(String[] args) {
+        StringAnyContains udf=new StringAnyContains();
+
+
+    }
+}

+ 27 - 0
src/main/java/com/winhc/bigdata/udf/StringCleanupChangeInfo.java

@@ -0,0 +1,27 @@
+package com.winhc.bigdata.udf;
+
+import com.aliyun.odps.udf.UDF;
+import com.aliyun.odps.utils.StringUtils;
+
+import java.util.regex.Pattern;
+
+/**
+ * @author ZhangJi
+ * @since 2022-03-30 13:35
+ */
+public class StringCleanupChangeInfo extends UDF {
+    private static final Pattern first_p = Pattern.compile("[^\\u4e00-\\u9fa50-9a-zA-Z()()]");
+    private static final Pattern second_p = Pattern.compile("[((][^((]+[))]$");
+    private static final Pattern third_p = Pattern.compile("[^\\u4e00-\\u9fa50-9a-zA-Z]");
+
+    public String evaluate(String val) {
+        if (StringUtils.isEmpty(val)) return "";
+        val = first_p.matcher(val).replaceAll("");
+        val = second_p.matcher(val).replaceAll("");
+        return third_p.matcher(val).replaceAll("");
+    }
+
+    public static void main(String[] args) {
+        System.out.println(new StringCleanupChangeInfo().evaluate("f (xx()))===="));
+    }
+}