手把手|20行Python代码教你批量将PDF文件转为Word格式(包教包会)

手把手|20行Python代码教你批量将PDF文件转为Word格式(包教包会)

2个月前 (03-08) 浏览: 77 评论: 0

在日常工作或学习中,经常会遇到这样的无奈: “小任,你把这个PDF中的文件码出来发我” 倒霉,2M的PDF12点也完不了啊! 很多时候在学习时发现许多文档都是PDF格式,PDF格式却不利于学习使用,因此需要将PDF转换为Word文件,但或许你从网上下载了很多软件,但只能转换前五页(如WPS等),要不就是需要收费,那有没有免费的转换软件呢? so,菜鸟分析给各位带来了一个免费简单快速的方法,手把手教

使用Python和Tesseract来识别图形验证码

使用Python和Tesseract来识别图形验证码

2个月前 (03-06) 浏览: 33 评论: 0

各位在企业中做Web漏洞扫描或者渗透测试的朋友,可能会经常遇到需要对图形验证码进行程序识别的需求。很多时候验证码明明很简单(对于非互联网企业,或者企业内网中的应用来说特别如此),但因为没有趁手的识别库,也只能苦哈哈地进行人肉识别,或者无奈地放弃任务。在这里,我分享一下自己使用Python和开源的tesseract OCR引擎做验证码识别的经验,并提供相关的源代码和示例供大家借鉴。 一、关于图形验证

运维学python之爬虫工具篇(一)Requests库的用法

运维学python之爬虫工具篇(一)Requests库的用法

3个月前 (01-10) 浏览: 103 评论: 0

历史: 运维学Python之爬虫基础篇(一)开篇:http://www.tiejiang.org/20403.html 运维学Python之爬虫基础篇(二)Urllib模块使用:http://www.tiejiang.org/20404.html 运维学Python之爬虫基础篇(三)Urllib模块高级用法:http://www.tiejiang.org/20405.html 运维学python之

运维学python之爬虫实战篇(一)爬取百度贴吧

运维学python之爬虫实战篇(一)爬取百度贴吧

4个月前 (12-27) 浏览: 96 评论: 0

历史: 运维学Python之爬虫基础篇(一)开篇:http://www.tiejiang.org/20403.html 运维学Python之爬虫基础篇(二)Urllib模块使用:http://www.tiejiang.org/20404.html 运维学Python之爬虫基础篇(三)Urllib模块高级用法:http://www.tiejiang.org/20405.html 运维学python之

运维学python之爬虫基础篇(五)正则表达式

运维学python之爬虫基础篇(五)正则表达式

4个月前 (12-26) 浏览: 43 评论: 0

历史: 运维学Python之爬虫基础篇(一)开篇:http://www.tiejiang.org/20403.html 运维学Python之爬虫基础篇(二)Urllib模块使用:http://www.tiejiang.org/20404.html 运维学Python之爬虫基础篇(三)Urllib模块高级用法:http://www.tiejiang.org/20405.html 运维学python之

运维学python之爬虫基础篇(四)Cookie

运维学python之爬虫基础篇(四)Cookie

4个月前 (12-26) 浏览: 42 评论: 0

历史: 运维学Python之爬虫基础篇(一)开篇:http://www.tiejiang.org/20403.html 运维学Python之爬虫基础篇(二)Urllib模块使用:http://www.tiejiang.org/20404.html 运维学Python之爬虫基础篇(三)Urllib模块高级用法:http://www.tiejiang.org/20405.html   在程序

运维学python之爬虫基础篇(三)urllib模块高级用法

运维学python之爬虫基础篇(三)urllib模块高级用法

4个月前 (12-25) 浏览: 58 评论: 0

历史: 运维学Python之爬虫基础篇(一)开篇:http://www.tiejiang.org/20403.html 运维学Python之爬虫基础篇(二)Urllib模块使用:http://www.tiejiang.org/20404.html 1 添加头信息 1.1 User-Agent 有些网站,如果你按照urllib.request.urlopen('https://www.baidu.c

运维学python之爬虫基础篇(二)urllib模块使用

运维学python之爬虫基础篇(二)urllib模块使用

4个月前 (12-25) 浏览: 60 评论: 0

历史: 运维学Python之爬虫基础篇(一)开篇:http://www.tiejiang.org/20403.html   1 何为爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。摘自百度百科 2 URL 2.1 URL含义 U

运维学python之爬虫基础篇(一)开篇

运维学python之爬虫基础篇(一)开篇

4个月前 (12-25) 浏览: 99 评论: 0

本人现职系统运维,随着技术发展,越来越多的系统开始提倡自动化运维,而且运维职位也不是几年前只懂shell就可以了,前几年找工作任职要求还是熟练shell,会python有加分,现在已经是熟悉shell、python、perl、java等语言任意两种,要求有所提高,所以有些压力的我也一直再搞python,无奈看了很多基础的文档了,最后还是有些无从下手的感觉,所以借着51CTO博客改版,把学习记录一下

你试过C语言和Python一起混合编程吗?两者相加不是已经无敌了!

你试过C语言和Python一起混合编程吗?两者相加不是已经无敌了!

4个月前 (12-12) 浏览: 74 评论: 0

C语言是编程语言的祖母,但是随着一代一代的编程语言长大,所以祖母也是会拍在沙滩上的,很多小小伙伴应该都会学过或者了解C语言,因为软件系的会教嘛,但是Python我想很多人都没学过,下面小编给大家介绍下,C语言和Python一起混合编程会产生什么不一样的火花吧! 在Mac OS X 下的编译命令同上 产生可执行文件后,直接运行,结果为输出 1 2 Hello Python! Python库函数PyR

如何用Python编写信息收集之子域名收集脚本

如何用Python编写信息收集之子域名收集脚本

5个月前 (12-04) 浏览: 48 评论: 0

0×00 前言 任务: 使用脚本借助搜索引擎搜集网站子域名信息。 准备工具: python安装包、pip、http请求库:requests库、正则库:re库。 子域名是相对于网站的主域名的。比如百度的主域名为:baidu.com,这是一个顶级域名,而在顶级域名前由"."隔开加上不同的字符,比如zhidao.baidu.com,那么这就是一个二级域名,同理,继续扩

简易Python Selenium爬虫实现歌曲免费下载

简易Python Selenium爬虫实现歌曲免费下载

6个月前 (10-26) 浏览: 97

最近发现越来越多的歌曲下载都需要缴费了,对维护正版是好事。但有的时候也想钻个空子,正好最近在学习python,随手写了一个建议爬虫,用来爬取某播放软件的在线音乐。 (本文仅代表作者观点, 思路与技术供参考、探讨,FreeBuf 依然鼓励维护正版。) 主要思路就是爬取播放页里的播放源文件的url,程序可以读取用户输入并返回歌单,,,因为在线网站包含大量js,requests就显得很无奈,又懒得手动解

多功能Python键盘记录工具:Radium

多功能Python键盘记录工具:Radium

6个月前 (10-20) 浏览: 98

所谓键盘记录,通常指的是记录下用户在键盘上所进行的按键操作,即记录下用户按过哪些键。这种键盘记录活动一般都是在后台悄悄进行的,所以使用键盘的用户通常并不会意识到自己的打字操作受到了非法监控。除此之外,攻击者还可以利用键盘记录来了解目标用户使用计算机的习惯。 今天给大家介绍的就是一款拥有多种功能的键盘记录工具-Radium,该工具采用Python语言编写,它拥有如下所示的多种功能: -应用程序以及键

切换注册

登录

忘记密码 ?

切换登录

注册

扫一扫二维码分享