Simon
/
sentiment-classification
mirror of https://github.com/hsuehkuan-lu/sentiment-classification


  
1

	
2

	
3

	
4

	
5

	
6

	
7

	
8

	
9

	
10

	
11

	
12

	
13

	
14

	
15

	
16

	
17

	
18

	
19

	
20

	
21

	
22

	
23

	
24

	
25

	
26

	
27

	
28

	
29

	
30

	
31

	
32

	
33

	
34

	
35

	
36

	
37

	
38

	
39

	
40

	
41

	
42

	
43

	
44

	
45

	
46

	
47

	
48

	
49

	
50

	
51

	
52

	
53

	
54

	
55

	
56

	
57

	
58

	
59

	
60

	
61

	
62

	
63

	
64

	
65

	
66

	
67

	
68

	
69

	
70

	
71

	
72

	
73

	
74

	
75

	
76

	
77

	
78

	
79

	
80

	
81

	
82

	
83

	
84

	
85

	
86

	
87

	
88

	
89

	
90

	
91

	
92

	
93

	
94

	
95

	
96

	
97

	
98

	
99

	
100

	
101

	
102

	
103

	
104

	
105

	
106

	
107

	
108

	
109

	
110

	
111

	
112

	
113

	
114

	
115

	
116

	
117

	
118

	
119

	
120

	
121

	
122

	
123

	
124

	
125

	
126

	
127

	
128

	
129

	
130

	
131

	
132

	
            seed: 123
gpu: 1
log_interval: 500

feature: review
label: sentiment
pad_token: <pad>
unk_token: <unk>
sos_token: <sos>
eos_token: <eos>
max_len: 512

basic:
  vocab_size: 50000
  min_freq: 3

lstm:
  embed_dim: 128
  use_bag: false
  use_eos: true
  attention_method: concat
  hidden_size: 512
  n_layers: 2
  dropout: 0.1
  max_len: 256

mlp:
  embed_dim: 128
  use_bag: true
  hidden_size: 512
  dropout: 0.1

cnn:
  embed_dim: 128
  use_bag: false
  use_eos: true
  hidden_size: 512
  kernel_size: 3
  n_layers: 4
  dropout: 0.33
  max_len: 512


selected:
  embed_size: 50
  use_bag: false
  attention_method: concat
  hidden_size: 512
  n_layers: 2
  dropout: 0.33

train:
  batch_size: 16
  shuffle: true
  epochs: 6
  early_stops: 2
  optimizer:
    lr: 2e-5
    step_lr: 500
    gamma: 0.5
    clip: 1.0
    weight_decay: 1e-5

validate:
  batch_size: 32
  shuffle: true
  epochs: 5
  kfold: 10
  early_stops: 3
  optimizer:
    lr: 1e-4
    step_lr: 500
    gamma: 0.5
    clip: 1.0
    weight_decay: 0

evaluate:
  batch_size: 64

bert:
  do_lower_case: true
  max_len: 128
  eval_max_len: 128
  bert_hidden_size: 1024
  basic:
    dropout: 0.1
  cnn:
    dropout: 0.1
    hidden_size: 1024
    kernel_size: 3
  lstm:
    hidden_size: 768
    dropout: 0.1
    n_layers: 2
    attention_method: concat


xlnet:
  do_lower_case: true
  max_len: 128
  eval_max_len: 128
  bert_hidden_size: 1024
  basic:
    dropout: 0.1
  cnn:
    dropout: 0.1
    hidden_size: 1024
    kernel_size: 3


roberta:
  do_lower_case: true
  max_len: 128
  eval_max_len: 128
  bert_hidden_size: 1024
  basic:
    dropout: 0.1
  cnn:
    dropout: 0.1
    hidden_size: 1024
    kernel_size: 3


albert:
  do_lower_case: true
  max_len: 128
  eval_max_len: 128
  bert_hidden_size: 2048
  cnn:
    dropout: 0
    hidden_size: 2048
    kernel_size: 3