全球专利数据库初探

因为近期要做一个创新方面的报告,在准备材料时,考虑引用全球专利统计分析数据来作为一个佐证。我尝试先从不同国家,地域,年龄,性别,民族等各个角度做一个简单的分析。.这就需要找到原始数据。实际上,美国专利局(USPTO)有一个公开的查询网页 (https://patft.uspto.gov/netahtml/PTO/search-bool.html),如下图所示,虽然略显朴素一些。

全球专利数据库初探

这个网站运行很慢(有可能跟我是在中国访问有关),我很快想到能否用自动化的工具来抓取一下数据, 一搜果然有呢,例如下面这个python的模块,就很简单实用。

全球专利数据库初探

但还是很慢,原因可能还是跟原始网站本身很慢有关系,无法忍受我还是放弃了,当然更重要的原因是我找到了更加好的方式。

实际上,该局还提供了一个更加可视化的网站 (https://patentsview.org/),并且已经提供了一些现成的统计分析结果,你直接使用就可以了。

下图是美国各州的发明人和组织的统计,加利福尼亚州是一个很厉害的州啊。

全球专利数据库初探

全球方面,亚洲力量不可忽视。东亚三兄弟(中日韩)居然独领风骚,位列三甲,实在是可喜可贺。

全球专利数据库初探

 

在技术领域方面,计算技术,数字通信,医疗技术,电子等领域是很热门的。

 

全球专利数据库初探

 

如果你这样还不过瘾,还可以直接下载元数据(tsv格式),我已经下载了主要的数据集用来做PowerBI报表。但需要注意,assignee和inventor,还有patent数据集都存在一些换行问题,我是通过手工进行了调整,其折腾过程并不那么美好,我已经不愿意多提起。

 

https://patentsview.org/download/data-download-tables

 

全球专利数据库初探

 

如果你还是想在你的应用中通过编程来访问这些数据,可以申请一个API Key(免费的哦),然后自由自在的进行你的探索。

 

全球专利数据库初探

 

下面是一个例子。

 

全球专利数据库初探

 

今日份分享到这里,如果你有兴趣,也可以多研究一下这些专利数据,以便了解世界上创新的一些趋势和规律。

 

如果有什么心得体会,也欢迎分享给我。