分为随机采样和相邻采样
参考链接
import torch
import random
def seq_data_iter_random(corpus, batch_size, num_steps): #@save
"""使用随机抽样生成一个小批量子序列"""
# 从随机偏移量开始对序列进行分区,随机范围包括num_steps-1
# 从[0,1,2,...]变成了[randint, randint+1, randint+2,...]
corpus = corpus[random.randint(0, num_steps - 1):]
print(corpus)
# 减去1,是因为我们需要考虑标签
num_subseqs = (len(corpus) - 1) // num_steps
# 长度为num_steps的子序列的起始索引
initial_indices = list(range(0, num_subseqs * num_steps, num_steps))
print('initial_indices:{}'.format(initial_indices))
# 在随机抽样的迭代过程中,
# 来自两个相邻的、随机的、小批量中的子序列不一定在原始序列上相邻
random.shuffle(initial_indices)
print(