有些内容页采集出来的数据是多条的,这种最具代表性的就是json格式的数据,比如:
{ "name": "中国", "province": [{ "name": "黑龙江", "cities": { "city": ["哈尔滨", "大庆"] } }, { "name": "广东", "cities": { "city": ["广州", "深圳", "珠海"] } }, { "name": "台湾", "cities": { "city": ["台北", "高雄"] } }, { "name": "新疆", "cities": { "city": ["乌鲁木齐"] } }]` }
采集这种数据下来要分条入库,在火车头软件里设置有核心三点: