Embedding 独热码:数量大,过于稀疏,映射之间是独立的,没有表现出关联性 Embedding:一种单词编码方法,以低维向量实现了编码,这种编码通过神经网络训练优化,能表达出单词的相关性。
TF描述Embedding层
tf.keras.layers.Embedding(词汇表大小,编码维度) # 编码维度就是用几个数字表达一个单词 # 对1-100进行编码, [4] 编码为 [0.25, 0.1, 0.11] tf.keras.layers.Embedding(100, 3 ) 入Embedding时, x_train维度:[送入样本数, 循环核时间展开步数]
RNN使用Embedding 编码,预测字母 import numpy as np import tensorflow as tf from tensorflow.