3
0

73 Commitit 35b532c999 ... 52311ec3b6

Tekijä SHA1 Viesti Päivämäärä
  JimZhang 52311ec3b6 Merge branch 'master' of http://139.224.213.4:3000/bigdata/UDF_Max 2 vuotta sitten
  JimZhang 3b8347bd94 feat: 公司类型 2 vuotta sitten
  JimZhang 00f940474a feat: 公司类型识别 2 vuotta sitten
  JimZhang 4c01e8d9bd Merge branch 'master' of http://139.224.213.4:3000/bigdata/UDF_Max 2 vuotta sitten
  JimZhang d87d02bc49 feat: add udf 2 vuotta sitten
  JimZhang 720123c4b6 feat: cleanup change info udf 2 vuotta sitten
  xufei 08f52b6a9d add udf 2 vuotta sitten
  xufei b4cd164df8 add udf 2 vuotta sitten
  许家凯 c81a31d40e feat: v7_tyc_company_compare 2 vuotta sitten
  许家凯 eeca233cb7 feat: amount_format 2 vuotta sitten
  xufei 76d51eab44 add udf 2 vuotta sitten
  xufei f2ca305b0b add udf 2 vuotta sitten
  xufei 272d573d49 add udf 2 vuotta sitten
  xufei 655b09a801 Merge remote-tracking branch 'origin/master' 2 vuotta sitten
  xufei 4276faf725 add udf 2 vuotta sitten
  xufei ba60a5b796 update 2 vuotta sitten
  许家凯 3eb88739dc feat: 添加查找繁体转简体异常问题 2 vuotta sitten
  xufei f903f5eb12 注册资本规整 2 vuotta sitten
  xufei f063ac3cb2 add udf 2 vuotta sitten
  许家凯 65a281eab1 feat: 添加注册资本格式化函数 2 vuotta sitten
  xufei 656cd385bb add udf 2 vuotta sitten
  xufei a54ecebc03 是否结案判断 2 vuotta sitten
  xufei 1fcd8ec891 udf add 2 vuotta sitten
  xufei d142c1d774 日期规整 2 vuotta sitten
  xufei 70bb4c7967 法人提取 2 vuotta sitten
  xufei 7c47868b84 注册资本修复 2 vuotta sitten
  xufei c614fad9d8 行业code转name 2 vuotta sitten
  许家凯 c0cf3f6dbf feat: add 2 vuotta sitten
  许家凯 6bc8605b24 feat: add 2 vuotta sitten
  xufei bc7128e507 兼容数值 2 vuotta sitten
  xufei 31a105193b url提取 3 vuotta sitten
  许家凯 cc0de7ac9b feat: add CompanyZxrRestrictPublishDate 3 vuotta sitten
  许家凯 8e92101c86 feat: add FieldsCompare 3 vuotta sitten
  xufei d681f21879 更新逻辑 3 vuotta sitten
  JimZhang dab2dd7c3e fix: 薪资转换优化特殊情况 3 vuotta sitten
  JimZhang d4475bdb2b feat: 薪资转换兼容更多情况 3 vuotta sitten
  JimZhang 4fc26d560d feat: 薪资转换 3 vuotta sitten
  xufei 081e319f2b 更新逻辑 3 vuotta sitten
  xufei d6df72c4c6 Merge remote-tracking branch 'origin/master' 3 vuotta sitten
  xufei 83d95e3210 更新逻辑 3 vuotta sitten
  xufei 7e542efc63 update 3 vuotta sitten
  xufei 5974bba2dc Merge remote-tracking branch 'origin/master' 3 vuotta sitten
  xufei d8e9b2799b 更新文书 3 vuotta sitten
  xufei f00fd9a773 add func 3 vuotta sitten
  xufei b749bbfc09 合并json 3 vuotta sitten
  许家凯 4f24d0b327 feat: add 3 vuotta sitten
  xufei ea9654db66 更新 3 vuotta sitten
  xufei 1f67fb532c 更新 3 vuotta sitten
  xufei db7b58a751 更新 3 vuotta sitten
  许家凯 f6138cb853 Merge remote-tracking branch 'origin/master' 3 vuotta sitten
  许家凯 94e3ab49c2 feat: add 3 vuotta sitten
  许家凯 6ba65c3092 feat: pom依赖排除其它包 3 vuotta sitten
  许家凯 123e64224a Merge remote-tracking branch 'origin/master' 3 vuotta sitten
  许家凯 b3fbe53244 feat: 添加依赖 3 vuotta sitten
  晏永年 2239c08589 concat_ws2 3 vuotta sitten
  xufei 8ea80cdd2b 添加函数 3 vuotta sitten
  许家凯 4b0345cb6e Merge remote-tracking branch 'origin/master' 3 vuotta sitten
  许家凯 bf41832bfd feat: 添加一系列函数 3 vuotta sitten
  许家凯 862942c7af Merge remote-tracking branch 'origin/master' 3 vuotta sitten
  许家凯 4a4fc0569c feat: 添加全角转半角函数 3 vuotta sitten
  xufei 1e3ffa72a7 udf更新 3 vuotta sitten
  xufei 36615f166c udf更新 3 vuotta sitten
  许家凯 d248596eec feat: 添加行业code函数 3 vuotta sitten
  许家凯 47a0709bab feat: 添加人名处理函数 3 vuotta sitten
  许家凯 8574333003 feat: 添加concat_cleanup函数 3 vuotta sitten
  许家凯 8bb16b840c feat: 添加身份证号提取、注册资本提取 3 vuotta sitten
  许家凯 83e6eb3f2e feat: 案号规整函数中文括号转英文 4 vuotta sitten
  许家凯 b64de49f0c Merge remote-tracking branch 'origin/master' 4 vuotta sitten
  许家凯 a87244ee81 feat: 添加案号规整函数 4 vuotta sitten
  许家凯 2b0136259b Merge branch 'master' of http://139.224.213.4:3000/bigdata/UDF_Max 4 vuotta sitten
  许家凯 329b2abbdc add company_split 4 vuotta sitten
  许家凯 b441632a77 添加币种提取udf 4 vuotta sitten
  许家凯 fab820d3ce init 4 vuotta sitten

+ 6 - 6
src/main/java/com/winhc/bigdata/udf/CompanyOrgTypeNew.java

@@ -16,20 +16,20 @@ public class CompanyOrgTypeNew extends UDF {
     private static final List<String> FOREIGN = Arrays.asList("中外", "外资", "外国", "外商");
     private static final List<String> CHINA = Arrays.asList("国有", "国资");
 
-    public List<String> evaluate(String company_org_type, String company_name, String credit_code) {
+    public String evaluate(String company_org_type, String company_name, String credit_code) {
         if (isEmpty(company_name)) return null;
 //分公司判断
-        if (contains(company_org_type, "分公司") || endsWith(company_name, "分公司")) {
+        if (contains(company_org_type, "分") || endsWith(company_name, "分公司")) {
             return null;
         }
 
 //工商注册类型判断
         Set<String> result = new HashSet<>();
-        if (contains(company_org_type, "股份") && !contains(company_org_type, "合作") && contains(company_name, "公司")) {
+        if (contains(company_org_type, "股份") && !contains(company_org_type, "合作") && contains(company_name, "公司")&&contains(company_name,"股份")) {
             result.add("股份有限公司");
         } else if (contains(company_org_type, "有限责任") || contains(company_name, "有限责任公司") || contains(company_name, "有限公司")) {
             result.add("有限责任公司");
-        } else if (contains(company_org_type, "股份合作")) {
+        } else if (contains(company_org_type, "股份合作")||contains(company_org_type,"股份制")) {
             result.add("股份合作企业");
         } else if (contains(company_org_type, "个体") || contains(company_org_type, "个人经营")) {
             result.add("个体工商户");
@@ -61,10 +61,10 @@ public class CompanyOrgTypeNew extends UDF {
         if (result.isEmpty()) {
             return null;
         }
-        return new ArrayList<>(result);
+        return JSON.toJSONString(result);
     }
 
     public static void main(String[] args) {
-        System.out.println(new CompanyOrgTypeNew().evaluate("有限公司", "雅诗兰黛(上海)商贸有限公司", "91110105MA01Q19Q2L"));
+        System.out.println(new CompanyOrgTypeNew().evaluate("分公司", "雅诗兰黛(上海)商贸有限公司北京分公司", "91110105MA01Q19Q2L"));
     }
 }

+ 61 - 0
src/main/java/com/winhc/bigdata/udf/FinancingRoundStd.java

@@ -0,0 +1,61 @@
+package com.winhc.bigdata.udf;
+
+import com.aliyun.odps.udf.UDF;
+import org.apache.commons.lang.StringUtils;
+
+import java.util.regex.Pattern;
+
+/**
+ * @author ZhangJi
+ * @since 2022-06-02 10:39
+ */
+public class FinancingRoundStd extends UDF {
+    private static final Pattern pattern = Pattern.compile("[^a-zA-Z种子轮/天使定向增发战略融资并购]");
+    private static final Pattern UP_E = Pattern.compile("[e-zE-Z]");
+
+    public String evaluate(String financing) {
+        if (StringUtils.isEmpty(financing)) {
+            return null;
+        }
+        String financing_std = pattern.matcher(financing).replaceAll("");
+        if (StringUtils.isEmpty(financing_std)) {
+            return "其他";
+        }
+        if (financing_std.contains("A") || financing_std.contains("a")) {
+            return "A轮";
+        }
+        if (financing_std.contains("B") || financing_std.contains("b")) {
+            return "B轮";
+        }
+        if (financing_std.contains("C") || financing_std.contains("c")) {
+            return "C轮";
+        }
+        if (financing_std.contains("D") || financing_std.contains("d")) {
+            return "D轮";
+        }
+        if (financing_std.contains("IPO") || financing_std.contains("ipo")) {
+            return "IPO";
+        }
+        if (financing_std.contains("天使") || financing_std.contains("种子")) {
+            return "种子轮/天使轮";
+        }
+        if (financing_std.contains("定向") || financing_std.contains("增发")) {
+            return "定向增发";
+        }
+        if (financing_std.contains("战略")) {
+            return "战略融资";
+        }
+        if (financing_std.contains("并购")) {
+            return "并购";
+        }
+        if (UP_E.matcher(financing_std).find()) {
+            return "E轮及以上";
+        }
+        return "其他";
+
+    }
+
+    public static void main(String[] args) {
+        System.out.println(new FinancingRoundStd().evaluate("股权融资"));
+    }
+}

+ 49 - 0
src/main/java/com/winhc/bigdata/udf/RegStatusStdTrim2.java

@@ -0,0 +1,49 @@
+package com.winhc.bigdata.udf;
+
+import com.aliyun.odps.udf.UDF;
+import com.aliyun.odps.utils.StringUtils;
+
+import java.util.Arrays;
+import java.util.List;
+import java.util.regex.Pattern;
+
+/**
+ * @author: XuJiakai
+ * 2021/1/27 15:36
+ */
+@SuppressWarnings("all")
+public class RegStatusStdTrim2 extends UDF {
+    private static final Pattern pattern = Pattern.compile("[^\\u4e00-\\u9fa5]");
+    private static final List<String> ZY = Arrays.asList("在业","在营","经营","有效","在册","存续","开业","正常","登记","迁入");
+
+    private static final List<String> TY = Arrays.asList("停业","停止经营","责令关闭","停工");
+    public String evaluate(String reg_status) {
+       return get_std(reg_status);
+    }
+
+    private static String get_std(String str) {
+        if (StringUtils.isEmpty(str)) {
+            return "其他";
+        }
+        String reg_status_clear = pattern.matcher(str).replaceAll("");
+        if (StringUtils.isEmpty(reg_status_clear)) {
+            return "其他";
+        }
+        if(ZY.stream().anyMatch(s->reg_status_clear.contains(s))){
+            return "存续";
+        } else if (reg_status_clear.contains("吊销")) {
+            return "吊销";
+        } else if (reg_status_clear.contains("注销")) {
+            return "注销";
+        } else if (reg_status_clear.contains("清算")) {
+            return "清算";
+        }  else if (reg_status_clear.contains("迁他") || reg_status_clear.contains("迁出")) {
+            return "迁出";
+        } else if (TY.stream().anyMatch(s->reg_status_clear.contains(s))) {
+            return "停业";
+        } else if (reg_status_clear.contains("撤销")) {
+            return "撤销";
+        }
+        return "其他";
+    }
+}