# O'Reilly Japan-Python-Book-2025
记录 [[O'Reilly Japan-Python-Book-Summary]] 2025年出版的 Python 相关的书。
## PythonによるWebスクレイピング 第3版
<https://www.oreilly.co.jp/books/9784814401222/>
> Webスクレイピングとは、インターネットからデータを機械的に集め、必要な情報を抽出する技術のことです。2019年の第2版発刊から約5年が経過し、生成AIの台頭で情報を得る方法も大きく変わりましたが、本当に欲しい情報を正しくピンポイントで得るためには、依然としてWebスクレイピングについての知識とスキルが必要です。本書では、インターネット上の膨大な情報の中から、生成AIや検索エンジンだけでは集められない本当に必要な正しい情報を入手する方法を、基礎からていねいに解説し、データの抽出、格納、収集後のクリーニング、さらにはJavaScriptの実行、OCRを含めた自然言語処理、並列処理などの高度なトピックもカバー。プログラミングテクニックとテクノロジー全般だけでなく、法律面の解説も加え、問題に遭遇した際の対処法まで紹介します。
> 网页抓取 (Web Scraping) 是一种从互联网上机械地收集数据并提取所需信息的技术。自 2019 年第二版发行以来已过去约五年,尽管 AI 极大地改变了获取信息的方式,但为了准确、精准地获得真正想要的信息,仍然需要掌握网页抓取的相关知识与技能。本书从基础开始,详细讲解了如何从互联网上的海量信息中,获取那些仅靠生成 AI 和搜索引擎无法收集到的、真正必要且准确的信息。内容涵盖数据提取、存储、收集后的清洗,以及 JavaScript 和 包含 OCR 在内的自然语言处理、并行处理等高级主题。不仅涉及编程技巧与全面技术,还加入了法律方面的解读,并介绍了遇到问题时的应对方法。
原书名 Web Scraping with Python, 3rd Edition,国内暂时没有第三版,但有第二版《[Python网络爬虫权威指南(第2版)](https://book.douban.com/subject/33386709/) 》。这本和崔老师的《Python3网络爬虫开发实战 (第2版)》应该是 Python 爬虫的必读书了。
## データサイエンスのための数学入門
<https://www.oreilly.co.jp/books/9784814401260/>
> 本書は、データサイエンスに欠かせない微積分・確率・線形代数・統計を、線形回帰・ロジスティック回帰・ニューラルネットワークといった実践的なアルゴリズムと結びつけて学べるハンズオンガイドです。数式による説明を最小限に抑え、SymPy、NumPy、scikit-learnなどのコード例を通じて直感的に理解し、実際に活用する力を養います。後半では、市場で評価されるスキルセットやデータサイエンス分野でのキャリア構築に役立つ実践的アドバイスも提供しています。読み終える頃には、強固な数理基盤と実践力を備え、自信を持って現場で活躍できる力が身についているはずです。
> 本书是一本动手实践指南,能够将数据科学不可或缺的微积分、概率、线性代数、统计学与线性回归、逻辑回归 (Logistic Regression)、神经网络等实用算法相结合进行学习。通过尽量减少数学公式的说明,借助 SymPy、NumPy、scikit-learn 等代码示例直观理解,培养实际应用能力。后半部分还提供了有助于获得市场认可的技能组合和在数据科学领域构建职业生涯的实用建议。读完本书时,您将建立起坚实的数理基础和实践能力,具备在职场中自信应对挑战的实力。
中译[《数据科学的数学基础》](https://book.douban.com/subject/36585934/),2023年就出版了。虽然豆瓣上现在评价不多,但都是正面评价。
## Think Stats 第3版
<https://www.oreilly.co.jp/books/9784814401376/>
> 本書は「プログラミングのスキルを統計学の理解に役立てよう」というコンセプトのもとで、多くの学生の支持を得ているPythonで統計学を学ぶ教科書です。統計学を学ぶ際に必要となる数学分野の知識をPythonのコードで示していくことによって、実データを分析しながらわかりやすく解説しています。プログラムはGoogle Colab上で動作できるように設計されているので、ライブラリのインストールや環境設定に悩まされることなく、すぐにプログラムを試すことができます。データのインポートとクリーニングといった前処理から仮説検定、回帰分析、時系列分析、生存時間解析といった高度な分析手法まで、一通りの統計学の分析を学ぶことができます。
> 本书基于"运用编程技能来理解统计学"的理念,通过 Python 学习统计学的教科书,在学生群体中广受好评。通过用 Python 代码演示统计学所需的数学知识,结合真实数据分析进行清晰易懂的讲解。程序专为在 Google Colab 上运行而设计,无需复杂的环境配置,即可立即开始实践。本书包括了从数据导入、数据清洗等预处理工作,到假设检验、回归分析、时间序列分析、生存时间分析 (Survival Analysis) 等高级分析方法,可以系统掌握完整的统计学分析流程。
国内暂时没有第三版,但有第二版《[统计思维 (第2版)](https://book.douban.com/subject/26593825/) 》。
## Effective Python 第3版
<https://www.oreilly.co.jp/books/9784814401338/>
> GoogleでPythonを使ったさまざまなサービスを立ち上げ、Pythonを知り尽くした著者による、Pythonエキスパート必携書の最新版です。第3版では、Python 3.13までの最新機能に対応し、第2版から新たに35項目を追加し、既存項目も時代に合わせて大幅に改訂されています。各項目では、優れたPythonコードを書くために何をすべきか、何を避けるべきか、そしてその理由をPythonの流儀に従って明確に解説。効率的でロバストであるだけでなく、読みやすく、保守しやすく、改善しやすいPythonicなコードを書く秘訣を学べます。Web開発、データ分析、自動化スクリプト、AI訓練まで、あらゆる分野でPythonの真の力を発揮したい開発者にとって、必読の一冊です。
国内暂时没有第三版,但有第二版《[Effective Python:编写高质量 Python 代码的 90 个有效方法(原书第 2 版)](https://book.douban.com/subject/35334595/) 》。
## データサイエンスのためのソフトウェアエンジニアリング入門
<https://www.oreilly.co.jp/books/9784814401321/>
> データサイエンティストがより良いコードを書くために、ソフトウェア開発の基本手法を学ぶための実践的なガイドブック。読みやすく保守しやすいPythonコードの書き方を具体的な例とともに解説します。テスト、ロギング、リファクタリング、ドキュメント、パフォーマンス、デプロイなど、実務に役立つ内容が満載です。AIがコードを自動生成する時代でも、コードの質を見極める力が重要だという視点に立脚し、自らの判断でコードを設計・評価できるスキルを身につける実用性重視の一冊。対象読者は、初中級者のデータサイエンティストおよびデータサイエンス分野への進出を考えているソフトウェア開発者。
原版 [Software Engineering for Data Scientists](https://book.douban.com/subject/36905341/) 是 2024 年出版,暂时没有中译版,但看介绍挺实用的。
## Fluent Python 第2版
<https://www.oreilly.co.jp/books/9784814401284/>
> ハードコアな読者から圧倒的な支持を受ける定番書籍の改訂版。本書では、Pythonの実務経験がある中・上級の開発者を対象に、Python言語の奥深さと高度な機能を実践的に解説します。本書を通してdoctestによる対話的な例を多用し、単なる知識の紹介にとどまらず、現場での応用力を高めるアプローチを重視しています。タプルのアンパック、デスクリプタ、メタクラスといったPython特有の機能に焦点を当てており、Pythonの能力を隅々まで使いきったコーディングを可能にします。
中译[《流畅的Python (第2版)》](https://book.douban.com/subject/36342440/)。
## Python Polars
<https://www.oreilly.co.jp/books/9784814401437/>
> Polarsは表形式のデータ構造であるDataFrameの処理を行うためのライブラリで、その高速性と優れたAPI設計から、現在広く用いられているpandasの後継として注目を集めています。高速性の源は、遅延実行を導入することで最適化を可能にしたこと、バックエンドにRustを用いることでマルチコアやSIMD命令を可能にしたことにあります。APIも「エクスプレッション」という概念を導入することで、シンプルかつ高機能にまとまっており、理解しやすく使いやすいものになっています。本書は Polars 開発者Ritchie Vink氏の所属するXomnia社の開発者二人により執筆され、Polars の基本的な使い方からより高度な最適化、並列化の方法をカバーしています。さらには内部構造やRustプラグインによる拡張方法にまで踏み込んでおり、Polars 解説書の決定版と言える内容です。
> Polars 是一个用于处理表格数据结构 DataFrame 的库,凭借其卓越的速度和优秀的 API 设计,作为当前广泛使用的 pandas 的替代方案而备受关注。其高速性能的源泉在于:通过引入延迟执行 (Lazy Execution) 实现优化,以及通过基于 Rust 的后端支持多核处理和 SIMD 指令。API 通过引入"表达式 (Expression)"的概念,实现了简洁而功能强大的设计,使其易于理解和使用。本书由 Polars 开发者 Ritchie Vink 所在的 Xomnia 公司的两位开发人员撰写,涵盖了从 Polars 的基本用法到更高级的优化和并行化方法。甚至深入探讨了内部结构以及通过 Rust 插件进行扩展的方法,堪称 Polars 指南的权威之作。
原版 [Python Polars The Definitive Guide](https://book.douban.com/subject/36675916/) 是 2025 年5月出版,暂时没有中译版,我对数据分析不太熟,就不点评了。