Dropbox 커넥터

개요

Dropbox 커넥터는 Dropbox 클라우드 스토리지에서 파일을 가져와서 Fess 인덱스에 등록하는 기능을 제공합니다.

이 기능을 사용하려면 fess-ds-dropbox 플러그인이 필요합니다.

지원 서비스

  • Dropbox (파일 스토리지)

  • Dropbox Paper (문서)

전제조건

  1. 플러그인 설치가 필요합니다

  2. Dropbox 개발자 계정과 애플리케이션 생성이 필요합니다

  3. 액세스 토큰 취득이 필요합니다

플러그인 설치

관리 화면의 “시스템” → “플러그인”에서 설치합니다:

  1. Maven Central에서 ``fess-ds-dropbox-X.X.X.jar``를 다운로드

  2. 플러그인 관리 화면에서 업로드하여 설치

  3. Fess 재시작

또는 자세한 내용은 플러그인 를 참조하세요.

설정 방법

관리 화면에서 “크롤러” → “데이터 스토어” → “새로 만들기”에서 설정합니다.

기본 설정

항목 설정 예
이름 Company Dropbox
핸들러 이름 DropboxDataStore 또는 DropboxPaperDataStore
활성화

파라미터 설정

access_token=sl.your-dropbox-token-here
basic_plan=false

파라미터 목록

파라미터 필수 설명
access_token Dropbox 액세스 토큰 (App Console에서 생성)
basic_plan 아니오 개인 계정인 경우 true, 팀 계정인 경우 false (기본값: false)
max_size 아니오 인덱싱 대상 최대 파일 크기(바이트) (기본값: 10000000)
number_of_threads 아니오 크롤링에 사용할 스레드 수 (기본값: 1)
ignore_folder 아니오 폴더 메타데이터를 건너뛸지 여부 (기본값: true)
ignore_error 아니오 콘텐츠 추출 중 오류를 무시할지 여부 (기본값: true)
supported_mimetypes 아니오 허용할 MIME 타입의 정규식 패턴(쉼표 구분) (기본값: .*)
include_pattern 아니오 크롤링에 포함할 URL 패턴
exclude_pattern 아니오 크롤링에서 제외할 URL 패턴
default_permissions 아니오 인덱싱된 문서의 기본 권한(쉼표 구분)
max_cached_content_size 아니오 메모리에 캐시할 콘텐츠 최대 크기(바이트) (기본값: 1048576)

스크립트 설정

Dropbox 파일의 경우

url=file.url
title=file.name
content=file.contents
mimetype=file.mimetype
filetype=file.filetype
filename=file.name
content_length=file.size
last_modified=file.client_modified
role=file.roles

사용 가능한 필드:

필드 설명
file.url 파일 미리보기 링크
file.contents 파일 텍스트 콘텐츠
file.mimetype 파일 MIME 타입
file.filetype 파일 타입
file.name 파일명
file.path_display 파일 경로
file.size 파일 크기 (바이트)
file.client_modified 클라이언트 측 최종 수정 일시
file.server_modified 서버 측 최종 수정 일시
file.roles 파일 액세스 권한
file.id Dropbox 파일 ID
file.path_lower 소문자 파일 경로
file.parent_shared_folder_id 상위 공유 폴더 ID
file.content_hash 콘텐츠 해시
file.rev 파일 리비전

Dropbox Paper의 경우

title=paper.title
content=paper.contents
url=paper.url
mimetype=paper.mimetype
filetype=paper.filetype
role=paper.roles

사용 가능한 필드:

필드 설명
paper.url Paper 문서 미리보기 링크
paper.contents Paper 문서 텍스트 콘텐츠
paper.mimetype MIME 타입
paper.filetype 파일 타입
paper.title Paper 문서 제목
paper.owner Paper 문서 소유자
paper.roles 문서 액세스 권한
paper.revision Paper 문서 리비전

Dropbox 인증 설정

액세스 토큰 취득 절차

1. Dropbox App Console에서 앱 생성

https://www.dropbox.com/developers/apps 에 접속:

  1. “Create app”을 클릭

  2. API 타입에서 “Scoped access”를 선택

  3. 액세스 타입에서 “Full Dropbox” 또는 “App folder”를 선택

  4. 앱 이름을 입력하고 생성

2. 권한 설정

“Permissions” 탭에서 필요한 권한을 선택:

파일 크롤링에 필요한 권한:

  • files.metadata.read - 파일 메타데이터 읽기

  • files.content.read - 파일 콘텐츠 읽기

  • sharing.read - 공유 정보 읽기

Paper 크롤링에 추가로 필요한 권한:

  • files.content.read - Paper 문서 읽기

3. 액세스 토큰 생성

“Settings” 탭에서:

  1. “Generated access token” 섹션까지 스크롤

  2. “Generate” 버튼 클릭

  3. 생성된 토큰 복사 (이 토큰은 한 번만 표시됩니다)

경고

액세스 토큰은 안전하게 보관하세요. 이 토큰이 있으면 Dropbox 계정에 액세스할 수 있습니다.

4. 토큰 설정

취득한 토큰을 파라미터에 설정:

access_token=sl.your-dropbox-token-here

개인 계정 설정

개인 계정 사용

개인 계정(팀 계정이 아닌 경우)에서는 basic_plan 파라미터를 ``true``로 설정하세요:

access_token=sl.your-dropbox-token-here
basic_plan=true

``false``(기본값)인 경우 팀 계정으로 동작하여 팀 멤버와 팀 폴더의 파일을 크롤링합니다. ``true``인 경우 개인 계정으로 동작하여 계정 내 파일을 직접 크롤링합니다.

사용 예

Dropbox 파일 전체 크롤링

파라미터:

access_token=sl.your-dropbox-token-here
basic_plan=false

스크립트:

url=file.url
title=file.name
content=file.contents
mimetype=file.mimetype
filetype=file.filetype
filename=file.name
content_length=file.size
last_modified=file.client_modified

Dropbox Paper 문서 크롤링

파라미터:

access_token=sl.your-dropbox-token-here
basic_plan=false

스크립트:

title=paper.title
content=paper.contents
url=paper.url
mimetype=paper.mimetype
filetype=paper.filetype

권한 포함 크롤링

파라미터:

access_token=sl.your-dropbox-token-here
basic_plan=false
default_permissions={role}admin

스크립트 (Dropbox 파일):

url=file.url
title=file.name
content=file.contents
mimetype=file.mimetype
filename=file.name
content_length=file.size
last_modified=file.client_modified
role=file.roles

스크립트 (Dropbox Paper):

title=paper.title
content=paper.contents
url=paper.url
mimetype=paper.mimetype
filetype=paper.filetype
role=paper.roles

특정 파일 타입만 크롤링

스크립트로 필터링:

# PDF와 Word 파일만
if (file.mimetype == "application/pdf" || file.mimetype == "application/vnd.openxmlformats-officedocument.wordprocessingml.document") {
    url=file.url
    title=file.name
    content=file.contents
    mimetype=file.mimetype
    filename=file.name
    last_modified=file.client_modified
}

문제 해결

인증 오류

증상: Invalid access token 또는 401 Unauthorized

확인 사항:

  1. 액세스 토큰이 올바르게 복사되었는지 확인

  2. 토큰 유효기간이 만료되지 않았는지 확인 (장기 토큰 사용)

  3. Dropbox App Console에서 필요한 권한이 부여되었는지 확인

  4. 앱이 비활성화되지 않았는지 확인

파일을 가져올 수 없음

증상: 크롤링은 성공하지만 파일이 0개

확인 사항:

  1. 앱의 “Access type”이 적절한지 확인:

    • “Full Dropbox”: Dropbox 전체에 액세스 가능

    • “App folder”: 특정 폴더만 액세스 가능

  2. 필요한 권한이 부여되었는지 확인:

    • files.metadata.read

    • files.content.read

    • sharing.read

  3. Dropbox 계정에 파일이 존재하는지 확인

API 속도 제한 오류

증상: 429 Too Many Requests 오류

해결 방법:

  1. Basic 플랜인 경우 basic_plan=true 설정

  2. 크롤링 간격을 늘림

  3. 여러 액세스 토큰을 사용하여 부하 분산

Paper 문서를 가져올 수 없음

증상: Paper 문서가 크롤링되지 않음

확인 사항:

  1. 핸들러 이름이 ``DropboxPaperDataStore``인지 확인

  2. 권한에 ``files.content.read``가 포함되어 있는지 확인

  3. Paper 문서가 실제로 존재하는지 확인

대량의 파일이 있는 경우

증상: 크롤링에 시간이 오래 걸리거나 타임아웃됨

해결 방법:

  1. 데이터 스토어를 여러 개로 분할 (폴더 단위 등)

  2. 스케줄 설정으로 부하 분산

  3. Basic 플랜인 경우 API 속도 제한에 주의

권한과 액세스 제어

Dropbox 공유 권한 반영

Dropbox 공유 설정을 Fess 권한에 반영할 수 있습니다:

파라미터:

access_token=sl.your-dropbox-token-here
default_permissions={role}dropbox-users

스크립트:

url=file.url
title=file.name
content=file.contents
role=file.roles
mimetype=file.mimetype
filename=file.name
last_modified=file.client_modified

file.roles 또는 ``paper.roles``에 Dropbox 공유 정보가 포함됩니다.

참고 정보