更新adaRNN

2023-08-17 16:30:05 +08:00 · 2023-08-17 16:30:05 +08:00 · 1d7bfec0f8
parent 14b7cb72a6
commit 1d7bfec0f8
17 changed files with 1372 additions and 0 deletions
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/init.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/init.py
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/adaRNN.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/adaRNN.py
@ -0,0 +1,361 @@
+import torch
+import torch.nn as nn
+from loss_transfer import TransferLoss
+import torch.nn.functional as F
+import tensorflow as tf
+
+
+'''
+参考：
+[1] https://arxiv.org/pdf/2108.04443.pdf
+[2] https://github.com/kevinding1125/transferlearning/blob/master/code/deep/adarnn/base/AdaRNN.py
+'''
+
+
+class AdaRNN(nn.Module):
+    """
+    model_type:  'Boosting', 'AdaRNN'
+    """
+
+    def __init__(self, use_bottleneck=False, bottleneck_width=256, n_input=128, n_hiddens=[64, 64], n_output=6, dropout=0.0, len_seq=9, model_type='AdaRNN', trans_loss='mmd'):
+        super(AdaRNN, self).__init__()
+        self.use_bottleneck = use_bottleneck
+        self.n_input = n_input
+        self.num_layers = len(n_hiddens)
+        self.hiddens = n_hiddens
+        self.n_output = n_output
+        self.model_type = model_type
+        self.trans_loss = trans_loss
+        self.len_seq = len_seq
+        in_size = self.n_input
+
+        features = nn.ModuleList()
+        for hidden in n_hiddens:
+            rnn = nn.GRU(
+                input_size=in_size,
+                num_layers=1,
+                hidden_size=hidden,
+                batch_first=True,
+                dropout=dropout
+            )
+            features.append(rnn)
+            in_size = hidden
+        self.features = nn.Sequential(*features)
+
+        if use_bottleneck == True:  # finance
+            self.bottleneck = nn.Sequential(
+                nn.Linear(n_hiddens[-1], bottleneck_width),
+                nn.Linear(bottleneck_width, bottleneck_width),
+                nn.BatchNorm1d(bottleneck_width),
+                nn.ReLU(),
+                nn.Dropout(),
+            )
+            self.bottleneck[0].weight.data.normal_(0, 0.005)
+            self.bottleneck[0].bias.data.fill_(0.1)
+            self.bottleneck[1].weight.data.normal_(0, 0.005)
+            self.bottleneck[1].bias.data.fill_(0.1)
+            self.fc = nn.Linear(bottleneck_width, n_output)
+            torch.nn.init.xavier_normal_(self.fc.weight)
+        else:
+            self.fc_out = nn.Linear(n_hiddens[-1], self.n_output)
+
+        if self.model_type == 'AdaRNN':
+            gate = nn.ModuleList()
+            for i in range(len(n_hiddens)):
+                gate_weight = nn.Linear(
+                    len_seq * self.hiddens[i]*2, len_seq)
+                gate.append(gate_weight)
+            self.gate = gate
+
+            bnlst = nn.ModuleList()
+            for i in range(len(n_hiddens)):
+                bnlst.append(nn.BatchNorm1d(len_seq))
+            self.bn_lst = bnlst
+            self.softmax = torch.nn.Softmax(dim=0)
+            self.init_layers()
+
+    def init_layers(self):
+        for i in range(len(self.hiddens)):
+            self.gate[i].weight.data.normal_(0, 0.05)
+            self.gate[i].bias.data.fill_(0.0)
+
+    def forward_pre_train(self, x, len_win=0):
+        out = self.gru_features(x)
+        fea = out[0]
+        if self.use_bottleneck == True:
+            fea_bottleneck = self.bottleneck(fea[:, -1, :])
+            fc_out = self.fc(fea_bottleneck).squeeze()
+        else:
+            fc_out = self.fc_out(fea[:, -1, :]).squeeze()
+
+        out_list_all, out_weight_list = out[1], out[2]
+        out_list_s, out_list_t = self.get_features(out_list_all)
+        loss_transfer = torch.zeros((1,)).cuda()
+        for i in range(len(out_list_s)):
+            criterion_transder = TransferLoss(
+                loss_type=self.trans_loss, input_dim=out_list_s[i].shape[2])
+            h_start = 0
+            for j in range(h_start, self.len_seq, 1):
+                i_start = j - len_win if j - len_win >= 0 else 0
+                i_end = j + len_win if j + len_win < self.len_seq else self.len_seq - 1
+                for k in range(i_start, i_end + 1):
+                    weight = out_weight_list[i][j] if self.model_type == 'AdaRNN' else 1 / (
+                        self.len_seq - h_start) * (2 * len_win + 1)
+                    loss_transfer = loss_transfer + weight * criterion_transder.compute(
+                        out_list_s[i][:, j, :], out_list_t[i][:, k, :])
+        return fc_out, loss_transfer, out_weight_list
+
+    def gru_features(self, x, predict=False):
+        x_input = x
+        out = None
+        out_lis = []
+        out_weight_list = [] if (
+             self.model_type == 'AdaRNN') else None
+        for i in range(self.num_layers):
+            out, _ = self.features[i](x_input.float())
+            x_input = out
+            out_lis.append(out)
+            if self.model_type == 'AdaRNN' and predict == False:
+                out_gate = self.process_gate_weight(x_input, i)
+                out_weight_list.append(out_gate)
+        return out, out_lis, out_weight_list
+
+    def process_gate_weight(self, out, index):
+        x_s = out[0: int(out.shape[0]//2)]
+        x_t = out[out.shape[0]//2: out.shape[0]]
+        x_all = torch.cat((x_s, x_t), 2)
+        x_all = x_all.view(x_all.shape[0], -1)
+        weight = torch.sigmoid(self.bn_lst[index](
+            self.gate[index](x_all.float())))
+        weight = torch.mean(weight, dim=0)
+        res = self.softmax(weight).squeeze()
+        return res
+
+    def get_features(self, output_list):
+        fea_list_src, fea_list_tar = [], []
+        for fea in output_list:
+            fea_list_src.append(fea[0: fea.size(0) // 2])
+            fea_list_tar.append(fea[fea.size(0) // 2:])
+        return fea_list_src, fea_list_tar
+
+    # For Boosting-based
+    def forward_Boosting(self, x, weight_mat=None):
+        out = self.gru_features(x)
+        fea = out[0]
+        if self.use_bottleneck:
+            fea_bottleneck = self.bottleneck(fea[:, -1, :])
+            fc_out = self.fc(fea_bottleneck).squeeze()
+        else:
+            fc_out = self.fc_out(fea[:, -1, :]).squeeze()
+
+        out_list_all = out[1]
+        out_list_s, out_list_t = self.get_features(out_list_all)
+        loss_transfer = torch.zeros((1,)).cuda()
+        if weight_mat is None:
+            weight = (1.0 / self.len_seq *
+                      torch.ones(self.num_layers, self.len_seq)).cuda()
+        else:
+            weight = weight_mat
+        dist_mat = torch.zeros(self.num_layers, self.len_seq).cuda()
+        for i in range(len(out_list_s)):
+            criterion_transder = TransferLoss(
+                loss_type=self.trans_loss, input_dim=out_list_s[i].shape[2])
+            for j in range(self.len_seq):
+                loss_trans = criterion_transder.compute(
+                    out_list_s[i][:, j, :], out_list_t[i][:, j, :])
+                loss_transfer = loss_transfer + weight[i, j] * loss_trans
+                dist_mat[i, j] = loss_trans
+        return fc_out, loss_transfer, dist_mat, weight
+
+    # For Boosting-based
+    def update_weight_Boosting(self, weight_mat, dist_old, dist_new):
+        epsilon = 1e-12
+        dist_old = dist_old.detach()
+        dist_new = dist_new.detach()
+        ind = dist_new > dist_old + epsilon
+        weight_mat[ind] = weight_mat[ind] * \
+            (1 + torch.sigmoid(dist_new[ind] - dist_old[ind]))
+        weight_norm = torch.norm(weight_mat, dim=1, p=1)
+        weight_mat = weight_mat / weight_norm.t().unsqueeze(1).repeat(1, self.len_seq)
+        return weight_mat
+
+    def predict(self, x):
+        out = self.gru_features(x, predict=True)
+        fea = out[0]
+        if self.use_bottleneck == True:
+            fea_bottleneck = self.bottleneck(fea[:, -1, :])
+            fc_out = self.fc(fea_bottleneck).squeeze()
+        else:
+            fc_out = self.fc_out(fea[:, -1, :]).squeeze()
+        return fc_out
+
+
+
+
+
+
+class AdaRNN_tensorflow(tf.keras.Model):
+    def __init__(self, use_bottleneck=False, bottleneck_width=256, n_input=128, n_hiddens=[64, 64], n_output=6, dropout=0.0, len_seq=9, model_type='AdaRNN', trans_loss='mmd'):
+        super(AdaRNN, self).__init__()
+        self.use_bottleneck = use_bottleneck
+        self.n_input = n_input
+        self.num_layers = len(n_hiddens)
+        self.hiddens = n_hiddens
+        self.n_output = n_output
+        self.model_type = model_type
+        self.trans_loss = trans_loss
+        self.len_seq = len_seq
+
+        self.features = tf.keras.Sequential()
+        for hidden in n_hiddens:
+            rnn = tf.keras.layers.GRU(
+                units=hidden,
+                return_sequences=True,
+                dropout=dropout
+            )
+            self.features.add(rnn)
+
+        if use_bottleneck == True:
+            self.bottleneck = tf.keras.Sequential([
+                tf.keras.layers.Dense(bottleneck_width),
+                tf.keras.layers.Dense(bottleneck_width),
+                tf.keras.layers.BatchNormalization(),
+                tf.keras.layers.ReLU(),
+                tf.keras.layers.Dropout(dropout)
+            ])
+            self.fc = tf.keras.layers.Dense(n_output, activation=None)
+
+        else:
+            self.fc_out = tf.keras.layers.Dense(n_output, activation=None)
+
+        if self.model_type == 'AdaRNN':
+            self.gate = []
+            for _ in range(len(n_hiddens)):
+                gate_weight = tf.keras.layers.Dense(len_seq, activation=None)
+                self.gate.append(gate_weight)
+            self.bn_lst = [tf.keras.layers.BatchNormalization() for _ in range(len(n_hiddens))]
+            self.softmax = tf.keras.layers.Softmax(axis=0)
+            # self.init_layers()  # 省去了很多初始化相关的工作
+
+    # def init_layers(self):
+    #     for gate_layer in self.gate:
+    #         gate_layer.build((None, self.len_seq * self.hiddens[i] * 2))
+
+    def forward_pre_train(self, x, len_win=0):
+        # 两层GRU之后的结果,每层GRU之后的结果,每层GRU前后权重归一化之后的结果
+        out, out_list_all, out_weight_list = self.gru_features(x)
+        fea =out
+        if self.use_bottleneck == True:
+            fea_bottleneck = self.bottleneck(fea[:, -1, :])
+            fc_out = self.fc(fea_bottleneck).squeeze()
+        else:
+            fc_out = self.fc_out(fea[:, -1, :]).squeeze()
+
+
+        out_list_s, out_list_t = self.get_features(out_list_all)
+
+        loss_transfer = tf.zeros((1,))
+        for i in range(len(out_list_s)):
+            criterion_transder = TransferLoss(
+                loss_type=self.trans_loss, input_dim=out_list_s[i].shape[2])
+            h_start = 0
+            for j in range(h_start, self.len_seq, 1):
+                i_start = j - len_win if j - len_win >= 0 else 0
+                i_end = j + len_win if j + len_win < self.len_seq else self.len_seq - 1
+                for k in range(i_start, i_end + 1):
+                    weight = out_weight_list[i][j] if self.model_type == 'AdaRNN' else 1 / (
+                        self.len_seq - h_start) * (2 * len_win + 1)
+                    loss_transfer = loss_transfer + weight * criterion_transder.compute(
+                        out_list_s[i][:, j, :], out_list_t[i][:, k, :])
+        return fc_out, loss_transfer, out_weight_list
+
+    def call(self, x, len_win=0, training=False):
+        # 两层GRU之后的结果,每层GRU之后的结果,每层GRU前后权重归一化之后的结果
+        out, out_list_all, out_weight_list = self.gru_features(x, training=training)
+        fea = out
+        if self.use_bottleneck == True:
+            fea_bottleneck = self.bottleneck(fea[:, -1, :])
+            fc_out = self.fc(fea_bottleneck)
+        else:
+            fc_out = self.fc_out(fea[:, -1, :])
+
+        loss_transfer = tf.zeros((1,))
+        for i in range(len(out_list_all)):
+            criterion_transder = TransferLoss(
+                loss_type=self.trans_loss, input_dim=out_list_all[i].shape[2])
+            h_start = 0
+            for j in range(h_start, self.len_seq, 1):
+                i_start = j - len_win if j - len_win >= 0 else 0
+                i_end = j + len_win if j + len_win < self.len_seq else self.len_seq - 1
+                for k in range(i_start, i_end + 1):
+                    weight = out_weight_list[i][j] if self.model_type == 'AdaRNN' else 1 / (
+                        self.len_seq - h_start) * (2 * len_win + 1)
+                    loss_transfer = loss_transfer + weight * criterion_transder.compute(
+                        out_list_all[i][:, j, :], out_list_all[i][:, k, :])
+        return fc_out, loss_transfer, out_weight_list
+
+    def gru_features(self, x, training=False):
+        x_input = x
+        out = None
+        out_lis = []
+        out_weight_list = [] if (
+             self.model_type == 'AdaRNN') else None
+        for i in range(self.num_layers):
+            out = self.features[i](x_input, training=training)
+            x_input = out
+            out_lis.append(out)
+            if self.model_type == 'AdaRNN':
+                out_gate = self.process_gate_weight(x_input, i, training=training)
+                out_weight_list.append(out_gate)
+        return out, out_lis, out_weight_list
+
+    def process_gate_weight(self, out, index, training=False):
+        x_s = out[:, :out.shape[1] // 2]# 可以理解为LSTM的前半段
+        x_t = out[:, out.shape[1] // 2:]# 可以理解为LSTM的后半段
+        x_all = tf.concat((x_s, x_t), 2)
+        x_all = tf.reshape(x_all, (x_all.shape[0], -1))
+        weight = tf.sigmoid(self.bn_lst[index](self.gate[index](x_all)), training=training)
+        weight = tf.reduce_mean(weight, axis=0)
+        res = self.softmax(weight)
+        return res
+
+    def get_features(self, output_list):
+        fea_list_src, fea_list_tar = [], []
+        for fea in output_list:
+            fea_list_src.append(fea[:, :fea.shape[1] // 2])
+            fea_list_tar.append(fea[:, fea.shape[1] // 2:])
+        return fea_list_src, fea_list_tar
+
+    def forward_Boosting(self, x, weight_mat=None):
+        out, out_list_all, _ = self.gru_features(x, training=False)
+        fea = out
+        if self.use_bottleneck:
+            fea_bottleneck = self.bottleneck(fea[:, -1, :])
+            fc_out = self.fc(fea_bottleneck)
+        else:
+            fc_out = self.fc_out(fea[:, -1, :])
+
+        out_list_all = out_list_all
+        out_list_s, out_list_t = self.get_features(out_list_all)
+        loss_transfer = tf.zeros((1,))
+        if weight_mat is None:
+            weight = (1.0 / self.len_seq *
+                      tf.ones((self.num_layers, self.len_seq), dtype=tf.float32))
+        else:
+            weight = weight_mat
+        dist_mat = tf.zeros((self.num_layers, self.len_seq), dtype=tf.float32)
+        for i in range(len(out_list_s)):
+            criterion_transder = TransferLoss(
+                loss_type=self.trans_loss, input_dim=out_list_s[i].shape[2])
+            for j in range(self.len_seq):
+                loss_trans = criterion_transder.compute(
+                    out_list_s[i][:, j, :], out_list_t[i][:, j, :])
+                loss_transfer = loss_transfer + weight[i, j] * loss_trans
+                dist_mat[i, j] = loss_trans
+        return fc_out, loss_transfer, dist_mat, weight
+
+    def update_weight_Boosting(self, weight_mat, dist_old, dist_new):
+        epsilon = 1e-12
+        dist_old = tf.stop_gradient(dist_old)
+        dist_new = tf.stop_gradient(dist_new)
+        ind = dist_new
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/dataset/init.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/dataset/init.py
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/dataset/data_act.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/dataset/data_act.py
@ -0,0 +1,108 @@
+# encoding=utf-8
+
+import numpy as np
+from torch.utils.data import Dataset, DataLoader
+from torchvision import transforms
+import os
+# from config import config_info
+from sklearn.preprocessing import StandardScaler
+
+
+# This is for parsing the X data, you can ignore it if you do not need preprocessing
+def format_data_x(datafile):
+    x_data = None
+    for item in datafile:
+        item_data = np.loadtxt(item, dtype=np.float)
+        if x_data is None:
+            x_data = np.zeros((len(item_data), 1))
+        x_data = np.hstack((x_data, item_data))
+    x_data = x_data[:, 1:]
+    print(x_data.shape)
+    X = None
+    for i in range(len(x_data)):
+        row = np.asarray(x_data[i, :])
+        row = row.reshape(9, 128).T
+        if X is None:
+            X = np.zeros((len(x_data), 128, 9))
+        X[i] = row
+    print(X.shape)
+    return X
+
+
+# This is for parsing the Y data, you can ignore it if you do not need preprocessing
+def format_data_y(datafile):
+    data = np.loadtxt(datafile, dtype=np.int) - 1
+    YY = np.eye(6)[data]
+    return YY
+
+
+# Load data function, if there exists parsed data file, then use it
+# If not, parse the original dataset from scratch
+def load_data(data_folder, domain):
+    import os
+    domain = '1_20' if domain == 'A' else '21_30'
+    data_file = os.path.join(data_folder, 'data_har_' + domain + '.npz')
+    if os.path.exists(data_file):
+        data = np.load(data_file)
+        X_train = data['X_train']
+        Y_train = data['Y_train']
+        X_test = data['X_test']
+        Y_test = data['Y_test']
+    else:
+        # This for processing the dataset from scratch
+        # After downloading the dataset, put it to somewhere that str_folder can find
+        str_folder = config_info['data_folder_raw'] + 'UCI HAR Dataset/'
+        INPUT_SIGNAL_TYPES = [
+            "body_acc_x_",
+            "body_acc_y_",
+            "body_acc_z_",
+            "body_gyro_x_",
+            "body_gyro_y_",
+            "body_gyro_z_",
+            "total_acc_x_",
+            "total_acc_y_",
+            "total_acc_z_"
+        ]
+
+        str_train_files = [str_folder + 'train/' + 'Inertial Signals/' + item + 'train.txt' for item in
+                           INPUT_SIGNAL_TYPES]
+        str_test_files = [str_folder + 'test/' + 'Inertial Signals/' +
+                          item + 'test.txt' for item in INPUT_SIGNAL_TYPES]
+        str_train_y = str_folder + 'train/y_train.txt'
+        str_test_y = str_folder + 'test/y_test.txt'
+
+        X_train = format_data_x(str_train_files)
+        X_test = format_data_x(str_test_files)
+        Y_train = format_data_y(str_train_y)
+        Y_test = format_data_y(str_test_y)
+
+    return X_train, onehot_to_label(Y_train), X_test, onehot_to_label(Y_test)
+
+
+def onehot_to_label(y_onehot):
+    a = np.argwhere(y_onehot == 1)
+    return a[:, -1]
+
+
+class data_loader(Dataset):
+    def __init__(self, samples, labels, t):
+        self.samples = samples
+        self.labels = labels
+        self.T = t
+
+    def __getitem__(self, index):
+        sample, target = self.samples[index], self.labels[index]
+        if self.T:
+            return self.T(sample), target
+        else:
+            return sample, target
+
+    def __len__(self):
+        return len(self.samples)
+
+
+def normalize(x):
+    x_min = x.min(axis=(0, 2, 3), keepdims=True)
+    x_max = x.max(axis=(0, 2, 3), keepdims=True)
+    x_norm = (x - x_min) / (x_max - x_min)
+    return x_norm
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/dataset/data_process.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/dataset/data_process.py
@ -0,0 +1,139 @@
+# encoding=utf-8
+import os
+import data_act as data_act
+import pandas as pd
+import data_weather as data_weather
+import datetime
+from ..loss_transfer import TransferLoss
+import torch
+import math
+import data_process
+
+
+def load_act_data(data_folder, batch_size=64, domain="1_20"):
+    x_train, y_train, x_test, y_test = data_act.load_data(data_folder, domain)
+    x_train, x_test = x_train.reshape(
+        (-1, x_train.shape[2], 1, x_train.shape[1])), x_test.reshape((-1, x_train.shape[2], 1, x_train.shape[1]))
+    transform = None
+    train_set = data_act.data_loader(x_train, y_train, transform)
+    test_set = data_act.data_loader(x_test, y_test, transform)
+    train_loader = data_act.DataLoader(
+        train_set, batch_size=batch_size, shuffle=True, drop_last=True)
+    test_loader = data_act.DataLoader(
+        test_set, batch_size=batch_size, shuffle=False)
+    return train_loader, train_loader, test_loader
+
+
+def load_weather_data(file_path, batch_size=6, station='Changping'):
+    data_file = os.path.join(file_path, "PRSA_Data_1.pkl")
+    mean_train, std_train = data_weather.get_weather_data_statistic(data_file, station=station,
+                                                                    start_time='2013-3-1 0:0',
+                                                                    end_time='2016-10-30 23:0')
+    train_loader = data_weather.get_weather_data(data_file, station=station, start_time='2013-3-6 0:0',
+                                                 end_time='2015-5-31 23:0', batch_size=batch_size, mean=mean_train,
+                                                 std=std_train)
+    valid_train_loader = data_weather.get_weather_data(data_file, station=station, start_time='2015-6-2 0:0',
+                                                       end_time='2016-6-30 23:0', batch_size=batch_size,
+                                                       mean=mean_train, std=std_train)
+    valid_vld_loader = data_weather.get_weather_data(data_file, station=station, start_time='2016-7-2 0:0',
+                                                     end_time='2016-10-30 23:0', batch_size=batch_size, mean=mean_train,
+                                                     std=std_train)
+    test_loader = data_weather.get_weather_data(data_file, station=station, start_time='2016-11-2 0:0',
+                                                end_time='2017-2-28 23:0', batch_size=batch_size, mean=mean_train,
+                                                std=std_train)
+    return train_loader, valid_train_loader, valid_vld_loader, test_loader
+
+
+def get_split_time(num_domain=2, mode='pre_process', data_file=None, station=None, dis_type='coral'):
+    spilt_time = {
+        '2': [('2013-3-6 0:0', '2015-5-31 23:0'), ('2015-6-2 0:0', '2016-6-30 23:0')]
+    }
+    if mode == 'pre_process':
+        return spilt_time[str(num_domain)]
+    if mode == 'tdc':
+        return TDC(num_domain, data_file, station, dis_type=dis_type)
+    else:
+        print("error in mode")
+
+
+def TDC(num_domain, data_file, station, dis_type='coral'):
+    start_time = datetime.datetime.strptime(
+        '2013-03-01 00:00:00', '%Y-%m-%d %H:%M:%S')
+    end_time = datetime.datetime.strptime(
+        '2016-06-30 23:00:00', '%Y-%m-%d %H:%M:%S')
+    num_day = (end_time - start_time).days
+    split_N = 10
+    data = pd.read_pickle(data_file)[station]
+    feat = data[0][0:num_day]
+    feat = torch.tensor(feat, dtype=torch.float32)
+    feat_shape_1 = feat.shape[1]
+    feat = feat.reshape(-1, feat.shape[2])
+    feat = feat.cuda()
+    # num_day_new = feat.shape[0]
+
+    selected = [0, 10]
+    candidate = [1, 2, 3, 4, 5, 6, 7, 8, 9]
+    start = 0
+
+    if num_domain in [2, 3, 5, 7, 10]:
+        while len(selected) - 2 < num_domain - 1:
+            distance_list = []
+            for can in candidate:
+                selected.append(can)
+                selected.sort()
+                dis_temp = 0
+                for i in range(1, len(selected) - 1):
+                    for j in range(i, len(selected) - 1):
+                        index_part1_start = start + math.floor(selected[i - 1] / split_N * num_day) * feat_shape_1
+                        index_part1_end = start + math.floor(selected[i] / split_N * num_day) * feat_shape_1
+                        feat_part1 = feat[index_part1_start: index_part1_end]
+                        index_part2_start = start + math.floor(selected[j] / split_N * num_day) * feat_shape_1
+                        index_part2_end = start + math.floor(selected[j + 1] / split_N * num_day) * feat_shape_1
+                        feat_part2 = feat[index_part2_start:index_part2_end]
+                        criterion_transder = TransferLoss(loss_type=dis_type, input_dim=feat_part1.shape[1])
+                        dis_temp += criterion_transder.compute(feat_part1, feat_part2)
+                distance_list.append(dis_temp)
+                selected.remove(can)
+            can_index = distance_list.index(max(distance_list))
+            selected.append(candidate[can_index])
+            candidate.remove(candidate[can_index])
+        selected.sort()
+        res = []
+        for i in range(1, len(selected)):
+            if i == 1:
+                sel_start_time = start_time + datetime.timedelta(days=int(num_day / split_N * selected[i - 1]), hours=0)
+            else:
+                sel_start_time = start_time + datetime.timedelta(days=int(num_day / split_N * selected[i - 1]) + 1,
+                                                                 hours=0)
+            sel_end_time = start_time + datetime.timedelta(days=int(num_day / split_N * selected[i]), hours=23)
+            sel_start_time = datetime.datetime.strftime(sel_start_time, '%Y-%m-%d %H:%M')
+            sel_end_time = datetime.datetime.strftime(sel_end_time, '%Y-%m-%d %H:%M')
+            res.append((sel_start_time, sel_end_time))
+        return res
+    else:
+        print("error in number of domain")
+
+
+def load_weather_data_multi_domain(file_path, batch_size=6, station='Changping', number_domain=2, mode='pre_process',
+                                   dis_type='coral'):
+    # mode: 'tdc', 'pre_process'
+    data_file = os.path.join(file_path, "PRSA_Data_1.pkl")
+    mean_train, std_train = data_weather.get_weather_data_statistic(data_file, station=station,
+                                                                    start_time='2013-3-1 0:0',
+                                                                    end_time='2016-10-30 23:0')
+    split_time_list = get_split_time(number_domain, mode=mode, data_file=data_file, station=station, dis_type=dis_type)
+    train_list = []
+    for i in range(len(split_time_list)):
+        time_temp = split_time_list[i]
+        train_loader = data_weather.get_weather_data(data_file, station=station, start_time=time_temp[0],
+                                                     end_time=time_temp[1], batch_size=batch_size, mean=mean_train,
+                                                     std=std_train)
+        train_list.append(train_loader)
+
+    valid_vld_loader = data_weather.get_weather_data(data_file, station=station, start_time='2016-7-2 0:0',
+                                                     end_time='2016-10-30 23:0', batch_size=batch_size, mean=mean_train,
+                                                     std=std_train)
+    test_loader = data_weather.get_weather_data(data_file, station=station, start_time='2016-11-2 0:0',
+                                                end_time='2017-2-28 23:0', batch_size=batch_size, mean=mean_train,
+                                                std=std_train, shuffle=False)
+    return train_list, valid_vld_loader, test_loader
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/dataset/data_weather.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/dataset/data_weather.py
@ -0,0 +1,132 @@
+import math
+import matplotlib.pyplot as plt
+import numpy as np
+import pandas as pd
+import os
+from pandas.core.frame import DataFrame
+from torch.utils.data import Dataset, DataLoader
+import torch
+import pickle
+import datetime
+
+
+class data_loader(Dataset):
+    def __init__(self, df_feature, df_label, df_label_reg, t=None):
+
+        assert len(df_feature) == len(df_label)
+        assert len(df_feature) == len(df_label_reg)
+
+        # df_feature = df_feature.reshape(df_feature.shape[0], df_feature.shape[1] // 6, df_feature.shape[2] * 6)
+        self.df_feature = df_feature
+        self.df_label = df_label
+        self.df_label_reg = df_label_reg
+
+        self.T = t
+        self.df_feature = torch.tensor(
+            self.df_feature, dtype=torch.float32)
+        self.df_label = torch.tensor(
+            self.df_label, dtype=torch.float32)
+        self.df_label_reg = torch.tensor(
+            self.df_label_reg, dtype=torch.float32)
+
+    def __getitem__(self, index):
+        sample, target, label_reg = self.df_feature[index], self.df_label[index], self.df_label_reg[index]
+        if self.T:
+            return self.T(sample), target
+        else:
+            return sample, target, label_reg
+
+    def __len__(self):
+        return len(self.df_feature)
+
+
+def create_dataset(df, station, start_date, end_date, mean=None, std=None):
+    data = df[station]
+    feat, label, label_reg = data[0], data[1], data[2]
+    referece_start_time = datetime.datetime(2013, 3, 1, 0, 0)
+    referece_end_time = datetime.datetime(2017, 2, 28, 0, 0)
+
+    assert (pd.to_datetime(start_date) - referece_start_time).days >= 0
+    assert (pd.to_datetime(end_date) - referece_end_time).days <= 0
+    assert (pd.to_datetime(end_date) - pd.to_datetime(start_date)).days >= 0
+    index_start = (pd.to_datetime(start_date) - referece_start_time).days
+    index_end = (pd.to_datetime(end_date) - referece_start_time).days
+    feat = feat[index_start: index_end + 1]
+    label = label[index_start: index_end + 1]
+    label_reg = label_reg[index_start: index_end + 1]
+
+    # ori_shape_1, ori_shape_2=feat.shape[1], feat.shape[2]
+    # feat=feat.reshape(-1, feat.shape[2])
+    # feat=(feat - mean) / std
+    # feat=feat.reshape(-1, ori_shape_1, ori_shape_2)
+
+    return data_loader(feat, label, label_reg)
+
+
+def create_dataset_shallow(df, station, start_date, end_date, mean=None, std=None):
+    data = df[station]
+    feat, label, label_reg = data[0], data[1], data[2]
+    referece_start_time = datetime.datetime(2013, 3, 1, 0, 0)
+    referece_end_time = datetime.datetime(2017, 2, 28, 0, 0)
+
+    assert (pd.to_datetime(start_date) - referece_start_time).days >= 0
+    assert (pd.to_datetime(end_date) - referece_end_time).days <= 0
+    assert (pd.to_datetime(end_date) - pd.to_datetime(start_date)).days >= 0
+    index_start = (pd.to_datetime(start_date) - referece_start_time).days
+    index_end = (pd.to_datetime(end_date) - referece_start_time).days
+    feat = feat[index_start: index_end + 1]
+    label = label[index_start: index_end + 1]
+    label_reg = label_reg[index_start: index_end + 1]
+
+    # ori_shape_1, ori_shape_2=feat.shape[1], feat.shape[2]
+    # feat=feat.reshape(-1, feat.shape[2])
+    # feat=(feat - mean) / std
+    # feat=feat.reshape(-1, ori_shape_1, ori_shape_2)
+
+    return feat, label_reg
+
+
+def get_dataset_statistic(df, station, start_date, end_date):
+    data = df[station]
+    feat, label = data[0], data[1]
+    referece_start_time = datetime.datetime(2013, 3, 1, 0, 0)
+    referece_end_time = datetime.datetime(2017, 2, 28, 0, 0)
+
+    assert (pd.to_datetime(start_date) - referece_start_time).days >= 0
+    assert (pd.to_datetime(end_date) - referece_end_time).days <= 0
+    assert (pd.to_datetime(end_date) - pd.to_datetime(start_date)).days >= 0
+    index_start = (pd.to_datetime(start_date) - referece_start_time).days
+    index_end = (pd.to_datetime(end_date) - referece_start_time).days
+    feat = feat[index_start: index_end + 1]
+    label = label[index_start: index_end + 1]
+    feat = feat.reshape(-1, feat.shape[2])
+    mu_train = np.mean(feat, axis=0)
+    sigma_train = np.std(feat, axis=0)
+
+    return mu_train, sigma_train
+
+
+def get_weather_data(data_file, station, start_time, end_time, batch_size, shuffle=True, mean=None, std=None):
+    df = pd.read_pickle(data_file)
+
+    dataset = create_dataset(df, station, start_time,
+                             end_time, mean=mean, std=std)
+    train_loader = DataLoader(
+        dataset, batch_size=batch_size, shuffle=shuffle)
+    return train_loader
+
+
+def get_weather_data_shallow(data_file, station, start_time, end_time, batch_size, shuffle=True, mean=None, std=None):
+    df = pd.read_pickle(data_file)
+
+    feat, label_reg = create_dataset_shallow(df, station, start_time,
+                                             end_time, mean=mean, std=std)
+
+    return feat, label_reg
+
+
+def get_weather_data_statistic(data_file, station, start_time, end_time):
+    df = pd.read_pickle(data_file)
+    mean_train, std_train = get_dataset_statistic(
+        df, station, start_time, end_time)
+    return mean_train, std_train
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/loss/init.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/loss/init.py
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/loss/mmd.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/loss/mmd.py
@ -0,0 +1,115 @@
+import torch
+import torch.nn as nn
+
+class MMD_loss(nn.Module):
+    def __init__(self, kernel_type='linear', kernel_mul=2.0, kernel_num=5):
+        super(MMD_loss, self).__init__()
+        self.kernel_num = kernel_num
+        self.kernel_mul = kernel_mul
+        self.fix_sigma = None
+        self.kernel_type = kernel_type
+
+    def guassian_kernel(self, source, target, kernel_mul=2.0, kernel_num=5, fix_sigma=None):
+        n_samples = int(source.size()[0]) + int(target.size()[0])
+        total = torch.cat([source, target], dim=0)
+        total0 = total.unsqueeze(0).expand(
+            int(total.size(0)), int(total.size(0)), int(total.size(1)))
+        total1 = total.unsqueeze(1).expand(
+            int(total.size(0)), int(total.size(0)), int(total.size(1)))
+        L2_distance = ((total0-total1)**2).sum(2)
+        if fix_sigma:
+            bandwidth = fix_sigma
+        else:
+            bandwidth = torch.sum(L2_distance.data) / (n_samples**2-n_samples)
+        bandwidth /= kernel_mul ** (kernel_num // 2)
+        bandwidth_list = [bandwidth * (kernel_mul**i)
+                          for i in range(kernel_num)]
+        kernel_val = [torch.exp(-L2_distance / bandwidth_temp)
+                      for bandwidth_temp in bandwidth_list]
+        return sum(kernel_val)
+
+    def linear_mmd(self, X, Y):
+        delta = X.mean(axis=0) - Y.mean(axis=0)
+        loss = delta.dot(delta.T)
+        return loss
+
+    def forward(self, source, target):
+        if self.kernel_type == 'linear':
+            return self.linear_mmd(source, target)
+        elif self.kernel_type == 'rbf':
+            batch_size = int(source.size()[0])
+            kernels = self.guassian_kernel(
+                source, target, kernel_mul=self.kernel_mul, kernel_num=self.kernel_num, fix_sigma=self.fix_sigma)
+            with torch.no_grad():
+                XX = torch.mean(kernels[:batch_size, :batch_size])
+                YY = torch.mean(kernels[batch_size:, batch_size:])
+                XY = torch.mean(kernels[:batch_size, batch_size:])
+                YX = torch.mean(kernels[batch_size:, :batch_size])
+                loss = torch.mean(XX + YY - XY - YX)
+            return loss
+
+
+import tensorflow as tf
+import numpy as np
+
+
+class MMDLoss(tf.keras.losses.Loss):
+    def __init__(self, kernel_type='linear', kernel_mul=2.0, kernel_num=5):
+        super(MMDLoss, self).__init__()
+        self.kernel_type = kernel_type
+        self.kernel_mul = kernel_mul
+        self.kernel_num = kernel_num
+
+    def guassian_kernel(self, source, target, kernel_mul=2.0, kernel_num=5, fix_sigma=None):
+        n_samples = int(source.shape[0]) + int(target.shape[0])
+        total = tf.concat([source, target], axis=0)
+        total0 = tf.expand_dims(total, 0)
+        total0 = tf.tile(total0, [total.shape[0], 1, 1])
+        total1 = tf.expand_dims(total, 1)
+        total1 = tf.tile(total1, [1, total.shape[0], 1])
+        L2_distance = tf.reduce_sum((total0 - total1) ** 2, axis=2)
+
+        if fix_sigma:
+            bandwidth = fix_sigma
+        else:
+            bandwidth = tf.reduce_sum(L2_distance) / (n_samples ** 2 - n_samples)
+        bandwidth /= kernel_mul ** (kernel_num // 2)
+        bandwidth_list = [bandwidth * (kernel_mul ** i)
+                          for i in range(kernel_num)]
+        kernel_val = [tf.exp(-L2_distance / bandwidth_temp)
+                      for bandwidth_temp in bandwidth_list]
+        return sum(kernel_val)
+
+    def linear_mmd(self, X, Y):
+        delta = tf.reduce_mean(X, axis=0) - tf.reduce_mean(Y, axis=0)
+        loss = tf.linalg.matmul(delta, delta, transpose_b=True)
+        return loss
+
+    def call(self, source, target):
+        if self.kernel_type == 'linear':
+            return self.linear_mmd(source, target)
+        elif self.kernel_type == 'rbf':
+            batch_size = int(source.shape[0])
+            kernels = self.guassian_kernel(
+                source, target, kernel_mul=self.kernel_mul, kernel_num=self.kernel_num, fix_sigma=None)
+            with tf.GradientTape(persistent=True) as tape:
+                tape.watch(kernels)
+                XX = tf.reduce_mean(kernels[:batch_size, :batch_size])
+                YY = tf.reduce_mean(kernels[batch_size:, batch_size:])
+                XY = tf.reduce_mean(kernels[:batch_size, batch_size:])
+                YX = tf.reduce_mean(kernels[batch_size:, :batch_size])
+                loss = XX + YY - XY - YX
+            return loss
+
+
+
+if __name__ == '__main__':
+    # 示例用法
+    source = np.random.randn(100, 128)
+    target = np.random.randn(100, 128)
+    source_tf = tf.convert_to_tensor(source, dtype=tf.float32)
+    target_tf = tf.convert_to_tensor(target, dtype=tf.float32)
+
+    mmd_loss = MMDLoss(kernel_type='rbf', kernel_mul=2.0, kernel_num=5)
+    loss = mmd_loss(source_tf, target_tf)
+    print("MMD Loss:", loss.numpy())
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/loss_transfer.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/loss_transfer.py
@ -0,0 +1,54 @@
+from loss import adv_loss, CORAL, kl_js, mmd, mutual_info, cosine, pairwise_dist
+
+
+class TransferLoss(object):
+    def __init__(self, loss_type='cosine', input_dim=512):
+        """
+        Supported loss_type: mmd(mmd_lin), mmd_rbf, coral, cosine, kl, js, mine, adv
+        """
+        self.loss_type = loss_type
+        self.input_dim = input_dim
+
+    def compute(self, X, Y):
+        """Compute adaptation loss
+
+        Arguments:
+            X {tensor} -- source matrix
+            Y {tensor} -- target matrix
+
+        Returns:
+            [tensor] -- transfer loss
+        """
+        if self.loss_type == 'mmd_lin' or self.loss_type =='mmd':
+            mmdloss = mmd.MMD_loss(kernel_type='linear')
+            loss = mmdloss(X, Y)
+        elif self.loss_type == 'coral':
+            loss = CORAL(X, Y)
+        elif self.loss_type == 'cosine' or self.loss_type == 'cos':
+            loss = 1 - cosine(X, Y)
+        elif self.loss_type == 'kl':
+            loss = kl_js.kl_div(X, Y)
+        elif self.loss_type == 'js':
+            loss = kl_js.js(X, Y)
+        elif self.loss_type == 'mine':
+            mine_model = mutual_info.Mine_estimator(
+                input_dim=self.input_dim, hidden_dim=60).cuda()
+            loss = mine_model(X, Y)
+        elif self.loss_type == 'adv':
+            loss = adv_loss.adv(X, Y, input_dim=self.input_dim, hidden_dim=32)
+        elif self.loss_type == 'mmd_rbf':
+            mmdloss = mmd.MMD_loss(kernel_type='rbf')
+            loss = mmdloss(X, Y)
+        elif self.loss_type == 'pairwise':
+            pair_mat = pairwise_dist(X, Y)
+            import torch
+            loss = torch.norm(pair_mat)
+
+        return loss
+
+if __name__ == "__main__":
+    import torch
+    trans_loss = TransferLoss('adv')
+    a = (torch.randn(5,512) * 10).cuda()
+    b = (torch.randn(5,512) * 10).cuda()
+    print(trans_loss.compute(a, b))
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/train_weather.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/adaRNN/train_weather.py
@ -0,0 +1,463 @@
+import torch.nn as nn
+import torch
+import torch.optim as optim
+
+import os
+import argparse
+import datetime
+import numpy as np
+
+from tqdm import tqdm
+from utils import utils
+from base.AdaRNN import AdaRNN
+
+import pretty_errors
+import dataset.data_process as data_process
+import matplotlib.pyplot as plt
+
+
+def pprint(*text):
+    # print with UTC+8 time
+    time = '[' + str(datetime.datetime.utcnow() +
+                     datetime.timedelta(hours=8))[:19] + '] -'
+    print(time, *text, flush=True)
+    if args.log_file is None:
+        return
+    with open(args.log_file, 'a') as f:
+        print(time, *text, flush=True, file=f)
+
+
+def get_model(name='AdaRNN'):
+    n_hiddens = [args.hidden_size for i in range(args.num_layers)]
+    return AdaRNN(use_bottleneck=True, bottleneck_width=64, n_input=args.d_feat, n_hiddens=n_hiddens,
+                  n_output=args.class_num, dropout=args.dropout, model_type=name, len_seq=args.len_seq,
+                  trans_loss=args.loss_type).cuda()
+
+
+def train_AdaRNN(args, model, optimizer, train_loader_list, epoch, dist_old=None, weight_mat=None):
+    model.train()
+    criterion = nn.MSELoss()
+    criterion_1 = nn.L1Loss()
+    loss_all = []
+    loss_1_all = []
+    dist_mat = torch.zeros(args.num_layers, args.len_seq).cuda()
+    len_loader = np.inf
+    for loader in train_loader_list:
+        if len(loader) < len_loader:
+            len_loader = len(loader)
+    for data_all in tqdm(zip(*train_loader_list), total=len_loader):
+        optimizer.zero_grad()
+        list_feat = []
+        list_label = []
+        for data in data_all:
+            feature, label, label_reg = data[0].cuda().float(
+            ), data[1].cuda().long(), data[2].cuda().float()
+            list_feat.append(feature)
+            list_label.append(label_reg)
+        flag = False
+        index = get_index(len(data_all) - 1)
+        for temp_index in index:
+            s1 = temp_index[0]
+            s2 = temp_index[1]
+            if list_feat[s1].shape[0] != list_feat[s2].shape[0]:
+                flag = True
+                break
+        if flag:
+            continue
+
+        total_loss = torch.zeros(1).cuda()
+        for i in range(len(index)):
+            feature_s = list_feat[index[i][0]]
+            feature_t = list_feat[index[i][1]]
+            label_reg_s = list_label[index[i][0]]
+            label_reg_t = list_label[index[i][1]]
+            feature_all = torch.cat((feature_s, feature_t), 0)
+
+            if epoch < args.pre_epoch:
+                pred_all, loss_transfer, out_weight_list = model.forward_pre_train(
+                    feature_all, len_win=args.len_win)
+            else:
+                pred_all, loss_transfer, dist, weight_mat = model.forward_Boosting(
+                    feature_all, weight_mat)
+                dist_mat = dist_mat + dist
+            pred_s = pred_all[0:feature_s.size(0)]
+            pred_t = pred_all[feature_s.size(0):]
+
+            loss_s = criterion(pred_s, label_reg_s)
+            loss_t = criterion(pred_t, label_reg_t)
+            loss_l1 = criterion_1(pred_s, label_reg_s)
+
+            total_loss = total_loss + loss_s + loss_t + args.dw * loss_transfer
+        loss_all.append(
+            [total_loss.item(), (loss_s + loss_t).item(), loss_transfer.item()])
+        loss_1_all.append(loss_l1.item())
+        optimizer.zero_grad()
+        total_loss.backward()
+        torch.nn.utils.clip_grad_value_(model.parameters(), 3.)
+        optimizer.step()
+    loss = np.array(loss_all).mean(axis=0)
+    loss_l1 = np.array(loss_1_all).mean()
+    if epoch >= args.pre_epoch:
+        if epoch > args.pre_epoch:
+            weight_mat = model.update_weight_Boosting(
+                weight_mat, dist_old, dist_mat)
+        return loss, loss_l1, weight_mat, dist_mat
+    else:
+        weight_mat = transform_type(out_weight_list)
+        return loss, loss_l1, weight_mat, None
+
+
+def train_epoch_transfer_Boosting(model, optimizer, train_loader_list, epoch, dist_old=None, weight_mat=None):
+    model.train()
+    criterion = nn.MSELoss()
+    criterion_1 = nn.L1Loss()
+    loss_all = []
+    loss_1_all = []
+    dist_mat = torch.zeros(args.num_layers, args.len_seq).cuda()
+    len_loader = np.inf
+    for loader in train_loader_list:
+        if len(loader) < len_loader:
+            len_loader = len(loader)
+    for data_all in tqdm(zip(*train_loader_list), total=len_loader):
+        optimizer.zero_grad()
+        list_feat = []
+        list_label = []
+        for data in data_all:
+            feature, label, label_reg = data[0].cuda().float(
+            ), data[1].cuda().long(), data[2].cuda().float()
+            list_feat.append(feature)
+            list_label.append(label_reg)
+        flag = False
+        index = get_index(len(data_all) - 1)
+        for temp_index in index:
+            s1 = temp_index[0]
+            s2 = temp_index[1]
+            if list_feat[s1].shape[0] != list_feat[s2].shape[0]:
+                flag = True
+                break
+        if flag:
+            continue
+
+        total_loss = torch.zeros(1).cuda()
+        for i in range(len(index)):
+            feature_s = list_feat[index[i][0]]
+            feature_t = list_feat[index[i][1]]
+            label_reg_s = list_label[index[i][0]]
+            label_reg_t = list_label[index[i][1]]
+            feature_all = torch.cat((feature_s, feature_t), 0)
+
+            pred_all, loss_transfer, dist, weight_mat = model.forward_Boosting(
+                feature_all, weight_mat)
+            dist_mat = dist_mat + dist
+            pred_s = pred_all[0:feature_s.size(0)]
+            pred_t = pred_all[feature_s.size(0):]
+
+            loss_s = criterion(pred_s, label_reg_s)
+            loss_t = criterion(pred_t, label_reg_t)
+            loss_l1 = criterion_1(pred_s, label_reg_s)
+
+            total_loss = total_loss + loss_s + loss_t + args.dw * loss_transfer
+
+        loss_all.append(
+            [total_loss.item(), (loss_s + loss_t).item(), loss_transfer.item()])
+        loss_1_all.append(loss_l1.item())
+        optimizer.zero_grad()
+        total_loss.backward()
+        torch.nn.utils.clip_grad_value_(model.parameters(), 3.)
+        optimizer.step()
+    loss = np.array(loss_all).mean(axis=0)
+    loss_l1 = np.array(loss_1_all).mean()
+    if epoch > 0:  # args.pre_epoch:
+        weight_mat = model.update_weight_Boosting(
+            weight_mat, dist_old, dist_mat)
+    return loss, loss_l1, weight_mat, dist_mat
+
+
+def get_index(num_domain=2):
+    index = []
+    for i in range(num_domain):
+        for j in range(i + 1, num_domain + 1):
+            index.append((i, j))
+    return index
+
+
+def train_epoch_transfer(args, model, optimizer, train_loader_list):
+    model.train()
+    criterion = nn.MSELoss()
+    criterion_1 = nn.L1Loss()
+    loss_all = []
+    loss_1_all = []
+    len_loader = np.inf
+    for loader in train_loader_list:
+        if len(loader) < len_loader:
+            len_loader = len(loader)
+
+    for data_all in tqdm(zip(*train_loader_list), total=len_loader):
+        optimizer.zero_grad()
+        list_feat = []
+        list_label = []
+        for data in data_all:
+            feature, label, label_reg = data[0].cuda().float(
+            ), data[1].cuda().long(), data[2].cuda().float()
+            list_feat.append(feature)
+            list_label.append(label_reg)
+        flag = False
+        index = get_index(len(data_all) - 1)
+        for temp_index in index:
+            s1 = temp_index[0]
+            s2 = temp_index[1]
+            if list_feat[s1].shape[0] != list_feat[s2].shape[0]:
+                flag = True
+                break
+        if flag:
+            continue
+
+        ###############
+        total_loss = torch.zeros(1).cuda()
+        for i in range(len(index)):
+            feature_s = list_feat[index[i][0]]
+            feature_t = list_feat[index[i][1]]
+            label_reg_s = list_label[index[i][0]]
+            label_reg_t = list_label[index[i][1]]
+            feature_all = torch.cat((feature_s, feature_t), 0)
+
+            pred_all, loss_transfer, out_weight_list = model.forward_pre_train(
+                feature_all, len_win=args.len_win)
+            pred_s = pred_all[0:feature_s.size(0)]
+            pred_t = pred_all[feature_s.size(0):]
+
+            loss_s = criterion(pred_s, label_reg_s)
+            loss_t = criterion(pred_t, label_reg_t)
+            loss_l1 = criterion_1(pred_s, label_reg_s)
+
+            total_loss = total_loss + loss_s + loss_t + args.dw * loss_transfer
+        loss_all.append(
+            [total_loss.item(), (loss_s + loss_t).item(), loss_transfer.item()])
+        loss_1_all.append(loss_l1.item())
+        optimizer.zero_grad()
+        total_loss.backward()
+        torch.nn.utils.clip_grad_value_(model.parameters(), 3.)
+        optimizer.step()
+    loss = np.array(loss_all).mean(axis=0)
+    loss_l1 = np.array(loss_1_all).mean()
+    return loss, loss_l1, out_weight_list
+
+
+def count_parameters(model):
+    return sum(p.numel() for p in model.parameters() if p.requires_grad)
+
+
+def test_epoch(model, test_loader, prefix='Test'):
+    model.eval()
+    total_loss = 0
+    total_loss_1 = 0
+    total_loss_r = 0
+    correct = 0
+    criterion = nn.MSELoss()
+    criterion_1 = nn.L1Loss()
+    for feature, label, label_reg in tqdm(test_loader, desc=prefix, total=len(test_loader)):
+        feature, label_reg = feature.cuda().float(), label_reg.cuda().float()
+        with torch.no_grad():
+            pred = model.predict(feature)
+        loss = criterion(pred, label_reg)
+        loss_r = torch.sqrt(loss)
+        loss_1 = criterion_1(pred, label_reg)
+        total_loss += loss.item()
+        total_loss_1 += loss_1.item()
+        total_loss_r += loss_r.item()
+    loss = total_loss / len(test_loader)
+    loss_1 = total_loss_1 / len(test_loader)
+    loss_r = loss_r / len(test_loader)
+    return loss, loss_1, loss_r
+
+
+def test_epoch_inference(model, test_loader, prefix='Test'):
+    model.eval()
+    total_loss = 0
+    total_loss_1 = 0
+    total_loss_r = 0
+    correct = 0
+    criterion = nn.MSELoss()
+    criterion_1 = nn.L1Loss()
+    i = 0
+    for feature, label, label_reg in tqdm(test_loader, desc=prefix, total=len(test_loader)):
+        feature, label_reg = feature.cuda().float(), label_reg.cuda().float()
+        with torch.no_grad():
+            pred = model.predict(feature)
+        loss = criterion(pred, label_reg)
+        loss_r = torch.sqrt(loss)
+        loss_1 = criterion_1(pred, label_reg)
+        total_loss += loss.item()
+        total_loss_1 += loss_1.item()
+        total_loss_r += loss_r.item()
+        if i == 0:
+            label_list = label_reg.cpu().numpy()
+            predict_list = pred.cpu().numpy()
+        else:
+            label_list = np.hstack((label_list, label_reg.cpu().numpy()))
+            predict_list = np.hstack((predict_list, pred.cpu().numpy()))
+
+        i = i + 1
+    loss = total_loss / len(test_loader)
+    loss_1 = total_loss_1 / len(test_loader)
+    loss_r = total_loss_r / len(test_loader)
+    return loss, loss_1, loss_r, label_list, predict_list
+
+
+def inference(model, data_loader):
+    loss, loss_1, loss_r, label_list, predict_list = test_epoch_inference(
+        model, data_loader, prefix='Inference')
+    return loss, loss_1, loss_r, label_list, predict_list
+
+
+def inference_all(output_path, model, model_path, loaders):
+    pprint('inference...')
+    loss_list = []
+    loss_l1_list = []
+    loss_r_list = []
+    model.load_state_dict(torch.load(model_path))
+    i = 0
+    list_name = ['train', 'valid', 'test']
+    for loader in loaders:
+        loss, loss_1, loss_r, label_list, predict_list = inference(
+            model, loader)
+        loss_list.append(loss)
+        loss_l1_list.append(loss_1)
+        loss_r_list.append(loss_r)
+        i = i + 1
+    return loss_list, loss_l1_list, loss_r_list
+
+
+def transform_type(init_weight):
+    weight = torch.ones(args.num_layers, args.len_seq).cuda()
+    for i in range(args.num_layers):
+        for j in range(args.len_seq):
+            weight[i, j] = init_weight[i][j].item()
+    return weight
+
+
+def main_transfer(args):
+    print(args)
+
+    output_path = args.outdir + '_' + args.station + '_' + args.model_name + '_weather_' + \
+                  args.loss_type + '_' + str(args.pre_epoch) + \
+                  '_' + str(args.dw) + '_' + str(args.lr)
+    save_model_name = args.model_name + '_' + args.loss_type + \
+                      '_' + str(args.dw) + '_' + str(args.lr) + '.pkl'
+    utils.dir_exist(output_path)
+    pprint('create loaders...')
+
+    train_loader_list, valid_loader, test_loader = data_process.load_weather_data_multi_domain(
+        args.data_path, args.batch_size, args.station, args.num_domain, args.data_mode)
+
+    args.log_file = os.path.join(output_path, 'run.log')
+    pprint('create model...')
+    model = get_model(args.model_name)
+    num_model = count_parameters(model)
+    print('#model params:', num_model)
+
+    optimizer = optim.Adam(model.parameters(), lr=args.lr)
+
+    best_score = np.inf
+    best_epoch, stop_round = 0, 0
+    weight_mat, dist_mat = None, None
+
+    for epoch in range(args.n_epochs):
+        pprint('Epoch:', epoch)
+        pprint('training...')
+        if args.model_name in ['Boosting']:
+            loss, loss1, weight_mat, dist_mat = train_epoch_transfer_Boosting(
+                model, optimizer, train_loader_list, epoch, dist_mat, weight_mat)
+        elif args.model_name in ['AdaRNN']:
+            loss, loss1, weight_mat, dist_mat = train_AdaRNN(
+                args, model, optimizer, train_loader_list, epoch, dist_mat, weight_mat)
+        else:
+            print("error in model_name!")
+        pprint(loss, loss1)
+
+        pprint('evaluating...')
+        train_loss, train_loss_l1, train_loss_r = test_epoch(
+            model, train_loader_list[0], prefix='Train')
+        val_loss, val_loss_l1, val_loss_r = test_epoch(
+            model, valid_loader, prefix='Valid')
+        test_loss, test_loss_l1, test_loss_r = test_epoch(
+            model, test_loader, prefix='Test')
+
+        pprint('valid %.6f, test %.6f' %
+               (val_loss_l1, test_loss_l1))
+
+        if val_loss < best_score:
+            best_score = val_loss
+            stop_round = 0
+            best_epoch = epoch
+            torch.save(model.state_dict(), os.path.join(
+                output_path, save_model_name))
+        else:
+            stop_round += 1
+            if stop_round >= args.early_stop:
+                pprint('early stop')
+                break
+
+    pprint('best val score:', best_score, '@', best_epoch)
+
+    loaders = train_loader_list[0], valid_loader, test_loader
+    loss_list, loss_l1_list, loss_r_list = inference_all(output_path, model, os.path.join(
+        output_path, save_model_name), loaders)
+    pprint('MSE: train %.6f, valid %.6f, test %.6f' %
+           (loss_list[0], loss_list[1], loss_list[2]))
+    pprint('L1:  train %.6f, valid %.6f, test %.6f' %
+           (loss_l1_list[0], loss_l1_list[1], loss_l1_list[2]))
+    pprint('RMSE: train %.6f, valid %.6f, test %.6f' %
+           (loss_r_list[0], loss_r_list[1], loss_r_list[2]))
+    pprint('Finished.')
+
+
+def get_args():
+    parser = argparse.ArgumentParser()
+
+    # model
+    parser.add_argument('--model_name', default='AdaRNN')
+    parser.add_argument('--d_feat', type=int, default=6)
+
+    parser.add_argument('--hidden_size', type=int, default=64)
+    parser.add_argument('--num_layers', type=int, default=2)
+    parser.add_argument('--dropout', type=float, default=0.0)
+    parser.add_argument('--class_num', type=int, default=1)
+    parser.add_argument('--pre_epoch', type=int, default=40)  # 20, 30, 50
+
+    # training
+    parser.add_argument('--n_epochs', type=int, default=200)
+    parser.add_argument('--lr', type=float, default=5e-4)
+    parser.add_argument('--early_stop', type=int, default=40)
+    parser.add_argument('--smooth_steps', type=int, default=5)
+    parser.add_argument('--batch_size', type=int, default=36)
+    parser.add_argument('--dw', type=float, default=0.5)  # 0.01, 0.05, 5.0
+    parser.add_argument('--loss_type', type=str, default='adv')
+    parser.add_argument('--station', type=str, default='Dongsi')
+    parser.add_argument('--data_mode', type=str,
+                        default='tdc')
+    parser.add_argument('--num_domain', type=int, default=2)
+    parser.add_argument('--len_seq', type=int, default=24)
+
+    # other
+    parser.add_argument('--seed', type=int, default=10)
+    parser.add_argument('--data_path', default="/root/Messi_du/adarnn/")
+    parser.add_argument('--outdir', default='./outputs')
+    parser.add_argument('--overwrite', action='store_true')
+    parser.add_argument('--log_file', type=str, default='run.log')
+    parser.add_argument('--gpu_id', type=int, default=0)
+    parser.add_argument('--len_win', type=int, default=0)
+    args = parser.parse_args()
+
+    return args
+
+
+if __name__ == '__main__':
+    args = get_args()
+    np.random.seed(args.seed)
+    torch.manual_seed(args.seed)
+    torch.cuda.manual_seed_all(args.seed)
+    torch.backends.cudnn.deterministic = True
+    torch.backends.cudnn.benchmark = False
+    os.environ["CUDA_VISIBLE_DEVICES"] = str(args.gpu_id)
+    main_transfer(args)
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/fouier_mix/init.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/fouier_mix/init.py
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/fouier_mix/attn.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/fouier_mix/attn.py
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/fouier_mix/attn_tensorflow.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/fouier_mix/attn_tensorflow.py
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/fouier_mix/fourier.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/fouier_mix/fourier.py
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/fouier_mix/fourier_tensorflow.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/fouier_mix/fourier_tensorflow.py
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/paraRCNN/ParaRCNN.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/paraRCNN/ParaRCNN.py
--- a/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/paraRCNN/init.py
+++ b/TensorFlow_eaxmple/Model_train_test/RUL/otherIdea/paraRCNN/init.py