grt1st's blog | 但行好事,莫问前程。

grt1st个人博客

序列到序列的语言翻译模型代码(tensorflow)解析

序列到序列的RNN语言机器翻译模型的tensorflow代码解析。 0x00.前言 这份代码最开始在基于RNN的语言模型与机器翻译NMT看到。本着溯本求源的心态,我搜了一下代码,找到了Brok-Bucholtz/P4-Beta/language_translation/dlnd_language_translation.ipynb 。 (更完整版在Language Translation 因......

tensorflow系列(4)tfrecords的使用

利用tfrecords文件格式来高效读取数据吧。 0x00.前言 最近涉及到模型的测试,需要读取数据。通常我们可以直接通过文件读取,自己写一个,方便快捷。但是考虑到要在集群上运行,这个数据文件(csv,约1.4G)在每台服务器上都要有,于是我想事先处理一下数据,看看能不能压缩或是缩小文件大小。于是我想到使用tfrecords这种文件格式。 这篇文章给我一种帮助文档的感觉,所以我没那么想发。考......

tensorflow系列(3)分布式tensorflow

多机如何分布式运行tensorflow模型? 0x00.前言 对于比较复杂的模型,在本机或者单服务器上跑起来需要很长时间。在很多科研单位或公司,可能没有插满gpu的服务器,这时候怎么办呢,有没有可能多台服务器一起跑一个模型呢? 这里就要用到分布式的tensorflow(distributed tensorflow)。 下面介绍在集群上部署tensorflow的方法。 0x01.基本概念 在分......

tensorflow系列(2)自编码器AE

自编码器(AE)的介绍及实现。 0x00.介绍 自编码(Auto-Encoder),简称ae,又有sae(稀疏自编码,Sparse Auto-Encoder)、dae(降噪自编码,Denoising Auto-Encoder)、rae(惩罚自编码,Regularized Auto-Encider)等分类。 基本的自编码网络可以看作一个由x->x的映射。它总共有两层神经网络,其中一层叫做......

tensorflow系列(1)碎碎念

谷歌开源的火爆的深度学习框架。一些零散的想法。 0x00.碎碎念 安装 可以从源码安装或者直接pip,推荐环境是python3.6而不是python2.7。 刚开始图方便直接pip安装,后来要用到gpu,pip安装的tensorflow编译的cudnn是5.1,我本地是6.0,所以下载源码重新编译了一下。 云服务器没有gpu,所以不管他。我本机是archlinux,官方仓库是cuda8.0......

子域名挖掘艺术

0x00.前言 在渗透测试过程中,如果主站没有可以利用的漏洞点,这时候应该怎么办?放弃吗?不,我们通常寻找域名下的子域名。或是子域名站与主站在同一台服务器上,或是子域名的服务器与主站服务器在同一内网,我们可以在内网里搞一波事情。 下面介绍几种子域名挖掘的方法。 0x01.爆破&&枚举 这种方法几乎无坚不摧,只要子域名存在就会被找出来。 这种方法也很简单,只需要1个字典,几个d......

词向量与word2vec分析

词嵌入(word embedding)、word2vec(cbow、skip-gram)与gensim使用

0x00.前言 前一阵子参加了科赛的一个数据的比赛,涉及了自然语言处理(nlp)。所以写一个总结,解释一下词向量(word embedding)、word2vec模型以及词向量的构造。 0x01.词向量 就像图片编码处理后进行模型训练一样,我们也要对文本进行处理,把它抽象为一个矩阵或者向量。通常我们处理的不是一段话、一个句子,而是一个单词或词语。对其进行处理的目的是将单词或词语转化为对计算......

代理池架构及实现

0x00.前言 很多网站都有反爬虫策略,当我们使用爬虫进行频繁的抓取时可能会被ban。面对这种情况,通常我们会对爬虫线程进行随机秒数的sleep。除此之外,对于不需要cookie的爬取需求,我们也可以使用多个代理(proxy)进行爬取。 本文即介绍代理池的架构、实现,给我们的爬虫用上随机代理。 0x01.基本架构 代理池的模块如下: 爬取免费代理 验证代理是否可用 可用代理存储 api输出......

浅析php反序列化漏洞

反序列化在很多语言中都比较常见,下面简单介绍php的反序列化漏洞(对象注入)。 原文发表在了freebuf: 由HITCON 2016一道web聊一聊php反序列化漏洞 ,但是最近看了一下,写的太烂了,所以重新写了一下。 0x00.是什么——what php反序列化漏洞,又叫对象注入。 涉及到的是php中的两个函数:unsearialize()与serialize()。后者为将一个对象或者数......

渗透测试过程中代理的使用

0x00.前言 当我们获得一个webshell时如何进入内网?如何在内网继续渗透扩大战果? 这是我一直以来都在纠结的问题,下面我尝试了几种实现方法。 (部分xxx为打码处理 0x01.socks代理 1.搭建代理 如果把目标服务器变成socks server还需要额外安装软件很明显是非常麻烦的,如果可以自己写一个简单的脚本很明显是非常好的。 参考:用Python写socks5服务器端| X......