Pythonのurllib2を使うことで、Webサイトにあるページソースを取得することができる。
使い方は、
>> import urllib2
>> url = 'xxx' # URLを文字列として用意
>> contents = urllib2.urlopen(url).readlines() # ページソースを1行単位で取得