分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - Tensorflow与RNN、双向LSTM等的踩坑记录及解决

Tensorflow与RNN、双向LSTM等的踩坑记录及解决

2021-11-18 10:05Orion Nebula Python

这篇文章主要介绍了Tensorflow与RNN、双向LSTM等的踩坑记录及解决方案，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教

1、tensorflow（不定长）文本序列读取与解析

tensorflow读取csv时需要指定各列的数据类型。

但是对于RNN这种接受序列输入的模型来说，一条序列的长度是不固定。这时如果使用csv存储序列数据，应当首先将特征序列拼接成一列。

例如两条数据序列，第一项是标签，之后是特征序列

[0, 1.1, 1.2, 2.3] 转换成 [0, '1.1_1.2_2.3']

[1, 1.0, 2.5, 1.6, 3.2, 4.5] 转换成 [1, '1.0_2.5_1.6_3.2_4.5']

这样每条数据都只包含固定两列了。

读取方式是指定第二列为字符串类型，再将字符串按照'_'分割并转换为数字。

关键的几行代码示例如下：

				?

									def readMyFileFormat(fileNameQueue):

									    reader = tf.TextLineReader()

									    key, value = reader.read(fileNameQueue)

									    record_defaults = [["Null"], [-1], ["Null"], ["Null"], [-1]]

									    phone1, seqlen, ts_diff_strseq, t_cod_strseq, userlabel = tf.decode_csv(value, record_defaults=record_defaults)

									    ts_diff_str = tf.string_split([ts_diff_strseq], delimiter='_')

									    t_cod_str = tf.string_split([t_cod_strseq], delimiter='_')

									    # 每个字符串转数字

									    Str2Float = lambda string: tf.string_to_number(string, tf.float32)

									    Str2Int = lambda string: tf.string_to_number(string, tf.int32)

									    ts_diff_seq = tf.map_fn(Str2Float, ts_diff_str.values, dtype = tf.float32) # 一定要加上dtype，且必须与fn的输出类型一致

									    t_cod_seq = tf.map_fn(Str2Int, t_cod_str.values, dtype = tf.int32)

2、时序建模的序列预测、序列拟合、标签预测，及输入数据格式

序列预测、拟合的“标签”都是序列本身，区别是未来时刻或者是当前时刻，当前时刻的拟合任务类似于antoencoder的reconstruction

标签预测常见于语言学建模，有单词级标签的分词与整句标签的情感分析，前者需要对每一个单词输入都要输出其分词标识，后者是取最后若干输出级联前馈神经网络分类器

keras的输入-输出对：需要将序列拆分成多个片段

序列形式：

按时间列表：static_bidirectional_rnn

多维数组：bidirectional_dynamic_rnn与stack_bidirectional_dynamic_rnn 变长双向rnn的正确使用姿势

3、多任务设置及相应的输出向量划分

对于标签预测任务，按需取输出即可

对于序列预测、拟合：

双向lstm：通常用于拟合。但如果需要捕捉动态信息，尽管需要序列完整输入，则仍可以加上正向预测与反向预测

单向lstm：拟合与预测

4、zero padding

后一般需要通过tf.boolean_mask()隔离这些零的影响，函数输入包括数据矩阵和补零位置的指示矩阵。

5、get_shape()方法

与 tf.shape() 类型区别，前者得到一个list，后者得到一个tensor

6、双向LSTM的信息瓶颈的解决

Tensorflow与RNN、双向LSTM等的踩坑记录及解决

如果在时间步的最后输出，则可能会导致开始的一些字符被遗忘门给遗忘。

所以这里就对每个时间步的输出做出了处理，

主要处理有：

1、拼接：把所有的输出拼接在一起。

2、Average

3、Pooling

以上为个人经验，希望能给大家一个参考，也希望大家多多支持服务器之家。

原文链接：https://zhuanlan.zhihu.com/p/36743184

延伸 · 阅读

2022-03-05如何使用C#将Tensorflow训练的.pb文件用在生产环境
2022-03-03教你在pycharm中使用tensorflow的方法
2022-02-28Python人工智能深度学习RNN模型结构流程
2022-02-28TensorFlow人工智能学习数据类型信息及转换
2022-02-27基于ubuntu16 Python3 tensorflow(TensorFlow环境搭建)
2022-02-27TensorFlow人工智能学习创建数据实现示例详解

精彩推荐

Python

python直接访问私有属性的简单方法

下面小编就为大家带来一篇python直接访问私有属性的简单方法。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧 ...

Python教程网5152020-09-03
Python

python 列表转为字典的两个小方法(小结)

这篇文章主要介绍了python 列表转为字典的两个小方法(小结)，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的...

出泥的鱼16542021-07-25
Python

Python的dict字典结构操作方法学习笔记

这篇文章主要介绍了Python的dict字典结构操作方法学习笔记本,字典的操作是Python入门学习中的基础知识,需要的朋友可以参考下...

Lizo_Is_Me4402020-08-22
Python

Python3以GitHub为例来实现模拟登录和爬取的实例讲解

在本篇内容里小编给大家分享的是关于Python3以GitHub为例来实现模拟登录和爬取的实例讲解，需要的朋友们可以参考下。 ...

爱喝马黛茶的安东尼5262020-07-31
Python

Python实现ping指定IP的示例

今天小编就为大家分享一篇Python实现ping指定IP的示例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...

EpisodeOne12902021-02-28
Python

在Windows系统上搭建Nginx+Python+MySQL环境的教程

这篇文章主要介绍了在Windows系统上搭建Nginx+Python+MySQL环境的教程,文中使用flup中间件及FastCGI方式连接,需要的朋友可以参考下 ...

没有终点的列车13242020-08-05
Python

使用NumPy和pandas对CSV文件进行写操作的实例

今天小编就为大家分享一篇使用NumPy和pandas对CSV文件进行写操作的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...

qq_2468356113602021-03-05
Python

python 插入Null值数据到Postgresql的操作

这篇文章主要介绍了python 插入Null值数据到Postgresql的操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...

MichaelZhu6452021-09-16