Data Factory 매핑 데이터 흐름을 사용하여 고정 길이 텍스트 파일 처리

2024-05-15

적용 대상: Azure Data Factory Azure Synapse Analytics

팁

기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아봅니다!

Microsoft Azure Data Factory에서 매핑 데이터 흐름을 사용하여 고정 폭 텍스트 파일에서 데이터를 변환할 수 있습니다. 다음 작업에서는 구분 기호 없이 텍스트 파일에 대한 데이터 세트를 정의한 다음 서수 위치에 따라 substring 분할을 설정합니다.

파이프라인을 만듭니다.

+새 파이프라인을 선택하여 새 파이프라인을 만듭니다.
고정 폭 파일을 처리하는 데 사용되는 데이터 흐름 작업을 추가합니다.
데이터 흐름 작업에서 새 매핑 데이터 흐름을 선택합니다.
원본, 파생 열, 선택 및 싱크 변환을 추가합니다.
새 데이터 세트를 사용하도록 Delimited Text 형식으로 원본 변환을 구성합니다.

열 구분 기호 또는 헤더를 설정하지 않습니다.

이제 이 파일의 콘텐츠에 대한 필드 시작 지점과 길이를 설정합니다.

1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468

원본 변환의 프로젝션 탭에 Column_1라는 문자열 열이 표시됩니다.
파생 열에서 새 열을 만듭니다.
열에는 col1과 같은 단순한 이름을 지정합니다.
식 작성기에서 다음을 입력합니다.

substring(Column_1,1,4)
구문 분석을 해야 하는 모든 열에 대해 10단계를 반복합니다.
검사 탭을 선택하여 생성될 새 열을 확인합니다.
변환 선택을 사용하여 변환에 필요하지 않은 열을 제거합니다.
싱크를 사용하여 데이터를 폴더에 출력합니다.

출력은 다음과 같습니다.

이제 고정 폭 데이터가 분할되어 각각 문자 4개를 사용하여 Col1, Col2, Col3, Col4 등에 할당됩니다. 위의 예제에 따라 데이터는 네 개의 열로 분할됩니다.

매핑 데이터 흐름 변환을 사용하여 나머지 데이터 흐름 논리를 빌드합니다.

피드백

이 페이지가 도움이 되었나요?

다음을 통해 공유

Data Factory 매핑 데이터 흐름을 사용하여 고정 길이 텍스트 파일 처리

파이프라인을 만듭니다.

관련 콘텐츠

피드백

추가 리소스