feelingstack
diff --git a/‎ERNIE/batching.py‎
Lines changed: 16 additions & 3 deletions b/‎ERNIE/batching.py‎
Lines changed: 16 additions & 3 deletions
diff --git a/‎ERNIE/finetune/classifier.py‎
Lines changed: 42 additions & 37 deletions b/‎ERNIE/finetune/classifier.py‎
Lines changed: 42 additions & 37 deletions
diff --git a/‎ERNIE/finetune_args.py‎
Lines changed: 2 additions & 1 deletion b/‎ERNIE/finetune_args.py‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎ERNIE/pretrain_args.py‎
Lines changed: 0 additions & 1 deletion b/‎ERNIE/pretrain_args.py‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎ERNIE/reader/pretraining.py‎
Lines changed: 11 additions & 7 deletions b/‎ERNIE/reader/pretraining.py‎
Lines changed: 11 additions & 7 deletions
@@ -19,7 +19,15 @@
 
 import numpy as np
 
-def mask(batch_tokens, seg_labels, mask_word_tags, total_token_num, vocab_size, CLS=1, SEP=2, MASK=3):
+
+def mask(batch_tokens,
+         seg_labels,
+         mask_word_tags,
+         total_token_num,
+         vocab_size,
+         CLS=1,
+         SEP=2,
+         MASK=3):
     """
     Add mask for batch_tokens, return out, mask_label, mask_pos;
     Note: mask_pos responding the batch_tokens after padded;
@@ -90,7 +98,8 @@ def mask(batch_tokens, seg_labels, mask_word_tags, total_token_num, vocab_size,
                     # random replace
                     if token != SEP and token != CLS:
                         mask_label.append(sent[token_index])
-                        sent[token_index] = replace_ids[prob_index + token_index]
+                        sent[token_index] = replace_ids[prob_index +
+                                                        token_index]
                         mask_flag = True
                         mask_pos.append(sent_index * max_len + token_index)
                 else:
@@ -143,7 +152,10 @@ def prepare_batch_data(insts,
     pos_id = pad_batch_data(batch_pos_ids, pad_idx=pad_id)
     sent_id = pad_batch_data(batch_sent_ids, pad_idx=pad_id)
 
-    return_list = [src_id, pos_id, sent_id, self_attn_bias, mask_label, mask_pos, labels, next_sent_index]
+    return_list = [
+        src_id, pos_id, sent_id, self_attn_bias, mask_label, mask_pos, labels,
+        next_sent_index
+    ]
 
     return return_list
 
@@ -207,4 +219,5 @@ def pad_batch_data(insts,
 
 
 if __name__ == "__main__":
+
     pass
@@ -25,22 +25,20 @@
 from model.ernie import ErnieModel
 
 
-def create_model(args,
-                 pyreader_name,
-                 ernie_config,
-                 is_prediction=False):
+def create_model(args, pyreader_name, ernie_config, is_prediction=False):
     pyreader = fluid.layers.py_reader(
         capacity=50,
         shapes=[[-1, args.max_seq_len, 1], [-1, args.max_seq_len, 1],
                 [-1, args.max_seq_len, 1],
-                [-1, args.max_seq_len, args.max_seq_len], [-1, 1], [-1, 1], [-1, 1]],
+                [-1, args.max_seq_len, args.max_seq_len], [-1, 1], [-1, 1],
+                [-1, 1]],
         dtypes=['int64', 'int64', 'int64', 'float', 'int64', 'int64', 'int64'],
         lod_levels=[0, 0, 0, 0, 0, 0, 0],
         name=pyreader_name,
         use_double_buffer=True)
 
-    (src_ids, sent_ids, pos_ids, self_attn_mask, labels,
-     next_sent_index, qids) = fluid.layers.read_file(pyreader)
+    (src_ids, sent_ids, pos_ids, self_attn_mask, labels, next_sent_index,
+     qids) = fluid.layers.read_file(pyreader)
 
     ernie = ErnieModel(
         src_ids=src_ids,
@@ -57,7 +55,7 @@ def create_model(args,
         dropout_implementation="upscale_in_train")
     logits = fluid.layers.fc(
         input=cls_feats,
-        size=ernie_config["num_labels"],
+        size=args.num_labels,
         param_attr=fluid.ParamAttr(
             name="cls_out_w",
             initializer=fluid.initializer.TruncatedNormal(scale=0.02)),
@@ -82,18 +80,21 @@ def create_model(args,
     num_seqs = fluid.layers.create_tensor(dtype='int64')
     accuracy = fluid.layers.accuracy(input=probs, label=labels, total=num_seqs)
 
-    graph_vars = {"loss": loss,
-                  "probs": probs,
-                  "accuracy": accuracy,
-                  "labels": labels,
-                  "num_seqs": num_seqs,
-                  "qids": qids}
+    graph_vars = {
+        "loss": loss,
+        "probs": probs,
+        "accuracy": accuracy,
+        "labels": labels,
+        "num_seqs": num_seqs,
+        "qids": qids
+    }
 
     for k, v in graph_vars.items():
-        v.persistable=True
+        v.persistable = True
 
     return pyreader, graph_vars
 
+
 def evaluate_mrr(preds):
     last_qid = None
     total_mrr = 0.0
@@ -114,6 +115,7 @@ def evaluate_mrr(preds):
 
     return total_mrr / qnum
 
+
 def evaluate_map(preds):
     def singe_map(st, en):
         total_p = 0.0
@@ -142,17 +144,18 @@ def singe_map(st, en):
     total_map += singe_map(st, len(preds))
     return total_map / qnum
 
+
 def evaluate(exe, test_program, test_pyreader, graph_vars, eval_phase):
-    train_fetch_list = [graph_vars["loss"].name,
-                        graph_vars["accuracy"].name,
-                        graph_vars["num_seqs"].name
-                       ] 
+    train_fetch_list = [
+        graph_vars["loss"].name, graph_vars["accuracy"].name,
+        graph_vars["num_seqs"].name
+    ]
 
     if eval_phase == "train":
         if "learning_rate" in graph_vars:
             train_fetch_list.append(graph_vars["learning_rate"].name)
         outputs = exe.run(fetch_list=train_fetch_list)
-        ret = {"loss":np.mean(outputs[0]), "accuracy":np.mean(outputs[1])}
+        ret = {"loss": np.mean(outputs[0]), "accuracy": np.mean(outputs[1])}
         if "learning_rate" in graph_vars:
             ret["learning_rate"] = float(outputs[4][0])
         return ret
@@ -162,22 +165,21 @@ def evaluate(exe, test_program, test_pyreader, graph_vars, eval_phase):
     qids, labels, scores = [], [], []
     time_begin = time.time()
 
-    fetch_list = [graph_vars["loss"].name,
-                  graph_vars["accuracy"].name,
-                  graph_vars["probs"].name,
-                  graph_vars["labels"].name,
-                  graph_vars["num_seqs"].name,
-                  graph_vars["qids"].name]
+    fetch_list = [
+        graph_vars["loss"].name, graph_vars["accuracy"].name,
+        graph_vars["probs"].name, graph_vars["labels"].name,
+        graph_vars["num_seqs"].name, graph_vars["qids"].name
+    ]
     while True:
         try:
-            np_loss, np_acc, np_probs, np_labels, np_num_seqs, np_qids = exe.run(program=test_program,
-                                                                                 fetch_list=fetch_list)
+            np_loss, np_acc, np_probs, np_labels, np_num_seqs, np_qids = exe.run(
+                program=test_program, fetch_list=fetch_list)
             total_cost += np.sum(np_loss * np_num_seqs)
             total_acc += np.sum(np_acc * np_num_seqs)
             total_num_seqs += np.sum(np_num_seqs)
             labels.extend(np_labels.reshape((-1)).tolist())
             qids.extend(np_qids.reshape(-1).tolist())
-            scores.extend(np_probs[:,1].reshape(-1).tolist())
+            scores.extend(np_probs[:, 1].reshape(-1).tolist())
             np_preds = np.argmax(np_probs, axis=1).astype(np.float32)
             total_label_pos_num += np.sum(np_labels)
             total_pred_pos_num += np.sum(np_preds)
@@ -188,20 +190,23 @@ def evaluate(exe, test_program, test_pyreader, graph_vars, eval_phase):
     time_end = time.time()
 
     if len(qids) == 0:
-        print("[%s evaluation] ave loss: %f, ave acc: %f, data_num: %d, elapsed time: %f s" %
-            (eval_phase, total_cost / total_num_seqs,
-            total_acc / total_num_seqs, total_num_seqs, time_end - time_begin))
+        print(
+            "[%s evaluation] ave loss: %f, ave acc: %f, data_num: %d, elapsed time: %f s"
+            % (eval_phase, total_cost / total_num_seqs, total_acc /
+               total_num_seqs, total_num_seqs, time_end - time_begin))
     else:
         r = total_correct_num / total_label_pos_num
         p = total_correct_num / total_pred_pos_num
         f = 2 * p * r / (p + r)
 
         assert len(qids) == len(labels) == len(scores)
-        preds = sorted(zip(qids, scores, labels), key=lambda elem:(elem[0], -elem[1]))
+        preds = sorted(
+            zip(qids, scores, labels), key=lambda elem: (elem[0], -elem[1]))
         mrr = evaluate_mrr(preds)
         map = evaluate_map(preds)
 
-        print("[%s evaluation] ave loss: %f, ave_acc: %f, mrr: %f, map: %f, p: %f, r: %f, f1: %f, data_num: %d, elapsed time: %f s" %
-              (eval_phase, total_cost / total_num_seqs,
-              total_acc / total_num_seqs,
-              mrr, map, p, r, f, total_num_seqs, time_end - time_begin))
+        print(
+            "[%s evaluation] ave loss: %f, ave_acc: %f, mrr: %f, map: %f, p: %f, r: %f, f1: %f, data_num: %d, elapsed time: %f s"
+            % (eval_phase, total_cost / total_num_seqs,
+               total_acc / total_num_seqs, mrr, map, p, r, f, total_num_seqs,
+               time_end - time_begin))
@@ -64,7 +64,7 @@
                "Whether to lower case the input text. Should be True for uncased models and False for cased models.")
 data_g.add_arg("random_seed",         int,  0,     "Random seed.")
 data_g.add_arg("label_map_config",    str,  None,  "label_map_path.")
-data_g.add_arg("num_labels",    int,  2,  "label number")
+data_g.add_arg("num_labels",          int,  2,     "label number")
 
 run_type_g = ArgumentGroup(parser, "run_type", "running type options.")
 run_type_g.add_arg("use_cuda",                     bool,   True,  "If set, use GPU for training.")
@@ -74,3 +74,4 @@
 run_type_g.add_arg("do_val",                       bool,   True,  "Whether to perform evaluation on dev data set.")
 run_type_g.add_arg("do_test",                      bool,   True,  "Whether to perform evaluation on test data set.")
 run_type_g.add_arg("metrics",                      bool,   True,  "Whether to perform evaluation on test data set.")
+# yapf: enable
@@ -24,7 +24,6 @@
 
 # yapf: disable
 parser = argparse.ArgumentParser(__doc__)
-parser = argparse.ArgumentParser(__doc__)
 model_g = ArgumentGroup(parser, "model", "model configuration and paths.")
 model_g.add_arg("ernie_config_path",      str,  "./config/ernie_config.json",  "Path to the json file for ernie model config.")
 model_g.add_arg("init_checkpoint",        str,  None,                         "Init checkpoint to resume training from.")
 
@@ -30,6 +30,7 @@
 
 from batching import prepare_batch_data
 
+
 class ErnieDataReader(object):
     def __init__(self,
                  filelist,
@@ -81,8 +82,8 @@ def parse_line(self, line, max_seq_len=512):
         sent_ids = [int(token) for token in sent_ids.split(" ")]
         pos_ids = [int(token) for token in pos_ids.split(" ")]
         seg_labels = [int(seg_label) for seg_label in seg_labels.split(" ")]
-        assert len(token_ids) == len(sent_ids) == len(
-            pos_ids) == len(seg_labels
+        assert len(token_ids) == len(sent_ids) == len(pos_ids) == len(
+            seg_labels
         ), "[Must be true]len(token_ids) == len(sent_ids) == len(pos_ids) == len(seg_labels)"
         label = int(label)
         if len(token_ids) > max_seq_len:
@@ -153,14 +154,17 @@ def split_sent(sample, max_len, sep_id):
             if left_len <= max_len:
                 return (token_seq[1:sep_index], seg_labels[1:sep_index])
             else:
-                return [token_seq[sep_index + 1: -1], seg_labels[sep_index + 1 : -1]]
+                return [
+                    token_seq[sep_index + 1:-1], seg_labels[sep_index + 1:-1]
+                ]
 
         for i in range(num_sample):
             pair_index = (i + 1) % num_sample
-            left_tokens, left_seg_labels = split_sent(pos_samples[i],
-                    (self.max_seq_len - 3) // 2, self.sep_id)
-            right_tokens, right_seg_labels = split_sent(pos_samples[pair_index],
-                    self.max_seq_len - 3 - len(left_tokens), self.sep_id)
+            left_tokens, left_seg_labels = split_sent(
+                pos_samples[i], (self.max_seq_len - 3) // 2, self.sep_id)
+            right_tokens, right_seg_labels = split_sent(
+                pos_samples[pair_index],
+                self.max_seq_len - 3 - len(left_tokens), self.sep_id)
 
             token_seq = [self.cls_id] + left_tokens + [self.sep_id] + \
                     right_tokens + [self.sep_id]