All Posts

用pathlib进行Python中的文件路径处理

介绍Python中的文件路径处理方法,从字符串连接、os.path.join()到Python3中处理文件路径的简单方法:pathlib。

Pandas中的数据重塑(Reshaping)

Pandas中的数据重塑(Reshaping): pivot, pivot_table, stack, unstack.

用机器学习应对气候变化?

气候变化是人类面临的越来越严重的问题,相信大家对此都不陌生。全球变暖、冰川消融、海平面上升、极端天气事件频发……人类的生存正在逐渐受到威胁。科学家们已经从很多不同的角度对气候变化进行了深入的研究,提出了很多应对气候变化的策略。除此之外,大家有没想过,近些年火遍各行各业的机器学习(ML)和人工智能(AI)可以与气候变化碰撞出什么样的火花呢?

剑指Offer刷题全纪录(Python版)

这篇文章是本人刷《剑指Offer》的记录,用Python实现的,也有一点点C++。 都说数据结构与算法是程序猿的必修课,是任何时候都需要苦修的内功。好吧,作为一个非科班的半路出家的野生程序猿,我当然也得刷一刷数据结构和算法啊啊啊。其实早在两年前就听闻要多刷算法题,那时候没有形成良好的习惯,也没制定详细的计划,就很佛的刷了一些LeetCode,感觉现在也都忘得一干二净了。最近心血来潮,正好遇到一个成长平台期,就开始下决心刷算法题了。

Pyquery解析库介绍

PyQuery库是一个强大的网页解析库,在很多方面会比beautifulsoup更优。PyQuery 是 Python 仿照 jQuery 的严格实现,语法与 jQuery 几乎完全相同。

BeautifulSoup库常用方法解析

Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库。可以对爬取的HTML源码做解析。

一文梳理正则表达式常用方法

正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。 —baidu百科 简单来说,正则表达式就是对字符串进行操作的一种逻辑公式,用事先定义好的⼀些规则,组成⼀个规则字符串,然后用这个规则字符串去匹配符合这个规则的字符串,实现对字符串的匹配和过滤。本文基于python中的re模块来介绍正则表达式的常见用法,但这并非Python独有的,绝大多数语言都支持正则表达式。

Python可视化:一些常用绘图脚本

个人整理的一些常用的绘图脚本,基于python的可视化库: matplotlib和seaborn。

Python命名空间和作用域

本文主要介绍一下Python命名空间和作用域。

用concurrent.futures模块实现并行

Python实现多线程/多进程,大家常常会用到标准库中的threading和multiprocessing模块。 但从Python3.2开始,标准库为我们提供了concurrent.futures模块,它提供了ThreadPoolExecutor和ProcessPoolExecutor两个类,实现了对threading和multiprocessing的进一步抽象,使得开发者只需编写少量代码即可让程序实现并行计算。