脚本说明:可以在几秒之内找出上百万个文件的不同点,原理:

#!/usr/bin/env python

#coding:utf-8

import sys

print 'sys.argv[1]',sys.argv[1]

print 'sys.argv[2]',sys.argv[2]

dict_file1={}

def openfile(file):

with open(file,'r') as temp:

content=temp.readlines()

temp.close()

if content:

return content

else:

return ''

file1=openfile(sys.argv[1])

for item in file1:

dict_file1[item.strip()] = ''

file2=openfile(sys.argv[2])

for item in file2:

if item.strip() in dict_file1:

print item.strip()

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注