콘텐츠로 이동

새 워크로드 등록

이 문서는 gcube에서 새로운 워크로드를 등록하는 방법을 설명합니다.
딥러닝 개발 환경 워크로드 등록 예시에서 실제 딥러닝 개발 환경 설정 예시를 확인할 수 있습니다.

워크로드 등록 순서

register-new-workload

1. 워크로드 탭에서 “새 워크로드 등록” 버튼을 클릭하세요.

2. 워크로드 등록 페이지에 각 항목을 입력합니다.

설명

input-workload-description

  • 워크로드 설명: 워크로드의 용도와 특징을 간단히 작성합니다.

컨테이너

input-workload-description

  • 저장소 유형: 컨테이너 이미지가 저장된 플랫폼을 선택하세요.

  • 컨테이너 이미지: 아래 저장소별 이미지 입력 형식을 참고하여 컨테이너 이미지 URL을 입력하세요.

  • 컨테이너 포트 : 컨테이너에서 사용하는 네트워크 포트입니다. 이미지 검증 시 자동으로 입력됩니다.

username/repository:tag
예시: ollama/ollama:latest

nvcr.io/nvidia/repository:tag
예시: nvcr.io/nvidia/cuda:12.0.0-base-ubuntu22.04

ghcr.io/owner/repository:tag
예시: ghcr.io/organization/app:1.0

quay.io/namespace/repository:tag
예시: quay.io/redhat/ubi8:latest

registry.hf.space/username/repository:tag
예시: registry.hf.space/username/model-server:v1

이미지 검증 확인

  • 정확한 이미지 URL을 입력하면 녹색 체크 표시가 나타나고 포트가 자동으로 입력됩니다.
  • 유효하지 않은 이미지는 빨간색 체크 표시가 나타나며 포트가 입력되지 않습니다.


목적스펙

input-workload-spec

  • 목적노드 : Tier별 공급 가능한 GPU 리소스 항목이 나타납니다.
    • 전체 : 사용 가능한 GPU 자동 할당
    • Tier 1 : 클라우드 사업자 (A100, H100 등)
    • Tier 2 : 전용 서버
    • Tier 3 : PC방, 개인
  • GPU 메모리 : 필요한 GPU 메모리의 용량을 설정합니다. 설정값에 따라 사용 가능한 GPU가 필터링됩니다.
  • GPU : 메모리 요구사항에 맞는 사용 가능한 GPU 모델이 표시되며, 특정 모델을 선택할 수 있습니다.


옵션

workload-option

  • 컨테이너 명령 : 컨테이너가 시작될 때 실행할 명령어를 지정합니다. 비워두면 도커 이미지에 설정된 기본 명령어가 실행됩니다.
  • 컨테이너 환경변수 : 컨테이너 내부에서 사용할 환경 변수를 설정하는 곳입니다. 필요한 경우에만 Key-Value 형식으로 입력합니다.
  • 레플리카 : 동일한 컨테이너를 몇 개 실행할지 지정합니다. 여러 개의 동일한 작업을 병렬로 실행해야 할 때 숫자를 증가시킵니다.
  • 최소 CUDA 버전 : 컨테이너가 요구하는 최소 CUDA 버전을 지정합니다.
  • 공유 메모리 : 컨테이너가 사용할 수 있는 공유 메모리의 크기를 GB 단위로 지정합니다. 대용량 데이터 처리가 필요한 경우에만 증가시킵니다.


등록

workload-registration

  • 총 예상 금액을 확인하고 즉시배포 여부를 선택한 후 “등록” 버튼을 클릭하세요.


workload-registration-complete

3. 워크로드가 생성되어 목록에서 확인하실 수 있습니다.