다음을 통해 공유


Data Factory 매핑 데이터 흐름을 사용하여 고정 길이 텍스트 파일 처리

적용 대상: Azure Data Factory Azure Synapse Analytics

기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아봅니다!

Microsoft Azure Data Factory에서 매핑 데이터 흐름을 사용하여 고정 폭 텍스트 파일에서 데이터를 변환할 수 있습니다. 다음 작업에서는 구분 기호 없이 텍스트 파일에 대한 데이터 세트를 정의한 다음 서수 위치에 따라 substring 분할을 설정합니다.

파이프라인을 만듭니다.

  1. +새 파이프라인을 선택하여 새 파이프라인을 만듭니다.

  2. 고정 폭 파일을 처리하는 데 사용되는 데이터 흐름 작업을 추가합니다.

    고정 너비 파이프라인

  3. 데이터 흐름 작업에서 새 매핑 데이터 흐름을 선택합니다.

  4. 원본, 파생 열, 선택 및 싱크 변환을 추가합니다.

    고정 너비 데이터 흐름

  5. 새 데이터 세트를 사용하도록 Delimited Text 형식으로 원본 변환을 구성합니다.

  6. 열 구분 기호 또는 헤더를 설정하지 않습니다.

    이제 이 파일의 콘텐츠에 대한 필드 시작 지점과 길이를 설정합니다.

    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    
  7. 원본 변환의 프로젝션 탭에 Column_1라는 문자열 열이 표시됩니다.

  8. 파생 열에서 새 열을 만듭니다.

  9. 열에는 col1과 같은 단순한 이름을 지정합니다.

  10. 식 작성기에서 다음을 입력합니다.

    substring(Column_1,1,4)

    파생 열(derived column)

  11. 구문 분석을 해야 하는 모든 열에 대해 10단계를 반복합니다.

  12. 검사 탭을 선택하여 생성될 새 열을 확인합니다.

    검사

  13. 변환 선택을 사용하여 변환에 필요하지 않은 열을 제거합니다.

    변환 선택

  14. 싱크를 사용하여 데이터를 폴더에 출력합니다.

    고정 너비 싱크

    출력은 다음과 같습니다.

    고정 너비 출력

이제 고정 폭 데이터가 분할되어 각각 문자 4개를 사용하여 Col1, Col2, Col3, Col4 등에 할당됩니다. 위의 예제에 따라 데이터는 네 개의 열로 분할됩니다.

  • 매핑 데이터 흐름 변환을 사용하여 나머지 데이터 흐름 논리를 빌드합니다.