テロメア込みでページをexportできるようにするscript
テロメア込みでページをexportできるようにするscript
用途
仕様
入力
exportしたいページのタイトルを羅列したリスト
適当なページを作り、そこに入力補完を使ってページタイトルを書き込んでいく
テロメア込みで
出力
exportしたいページの情報だけ含んだjson file
実装
を使ったcommad-line script
使うthird party package
↓これを参考にして作る
script.pyimport json
import re
nikkei_scraps = []
with open('nikkei_scrap.json') as json_data:
page_data = json.load(json_data)
nikkei_scraps = [page['title']
for page in page_data['relatedPages']['links1hop']]
with open('takker-memex.json') as json_data:
page_data = json.load(json_data)
newspaper_data = {'pages': [page for page in page_data['pages']
if (page['title'] in nikkei_scraps) and re.search('日本経済新聞|NIKKEI|日経', page['title'])]}
print(f'Got {len(newspaper_data["pages"])} pages')
with open('output.json', 'w') as output:
json.dump(newspaper_data, output, indent=4, ensure_ascii=False)