0. 엑셀에서 데이터 불러오기
df = pd.read_excel('22\'10_수요기업조사/1. keti_관심(85건)/{}'.format(file_list[i]))
0-1. 첫 열에 원하는 값 추가
df.insert(0, 'patent', patent_list[i])
1. 특정 열의 값이 중복된 행 제거
df = df.drop_duplicates(['출원인'])
2. 특정 열에 특정 텍스트가 들어가있는 것만을 살리기
2-1. 빈 값 일괄 채우기(2에서 사용하는 함수가 참/거짓 판정이 불가능한 빈 값을 보면 일을 안한다)
df = df[df['출원인'].str.contains('주식회사|(주)|유한회사|(유)')]
3. 특정 열의 값을 숫자로 비교해서 낮은것(혹은 높은 값) 제외
3-1. 행의 갯수를 제한하기
df = df[df['value'] <= 0.80].head(40)
4. 열의 갯수 제한하기
df = df[0:7]
5. 엑셀 파일로 데이터프레임 저장하기
PatentDataFrame = pd.concat([PatentDataFrame,df],ignore_index=True)