瀏覽代碼

feat: 调整拉数据策略

许家凯 2 年之前
父節點
當前提交
cbb8d7677a
共有 1 個文件被更改,包括 18 次插入2 次删除
  1. 18 2
      handle/pull_sample_data.py

+ 18 - 2
handle/pull_sample_data.py

@@ -48,6 +48,13 @@ def pull_by_es(size: int = 20):
                 "must": [
                     {
                         "term": {
+                            "company_type": {
+                                "value": "1"
+                            }
+                        }
+                    },
+                    {
+                        "term": {
                             "deleted": {
                                 "value": "0"
                             }
@@ -159,11 +166,20 @@ def pull_by_max(size=100000):
     pass
 
 
+def pull(size):
+    if size > 10000:
+        pull_by_max(size)
+    else:
+        pull_by_es(500)
+        pass
+    pass
+
+
 if __name__ == '__main__':
     log.info(f"input args: {sys.argv}")
 
     if len(sys.argv) >= 2:
-        pull_by_max(size=int(sys.argv[1]))
+        pull(size=int(sys.argv[1]))
     else:
-        pull_by_max(size=1000)
+        pull(size=1000)
     pass