일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 트리맵
- 코테
- 프로젝트
- flyway
- 컴퓨터구조
- 운영체제
- CS
- BFS
- springboot
- 트리셋
- CPU스케줄링
- findById
- DB replication
- 파이널프로젝트
- 임베디드타입
- 그래프탐색
- 구현
- 외래키제약조건위반
- 스케일아웃
- 백준
- 폰켓몬
- 해시
- SpringBatch
- JPA
- Spring JPA
- 프로그래머스
- 산업은행it
- fatch
- 2178
- 산업은행청년인턴
- Today
- Total
목록DevOps, MLOps (18)
나 JAVA 봐라

[로컬 K8s에 Kubeflow 설치하기] Kubeflow는 K8s 위에서 동작하는 ML 플랫폼이기 때문에, Kubeflow를 사용하려면 먼저 K8s를 설치해야 한다. K8s 설치K8s를 설치하는 방법도 여러 가지가 있는데, 보통 초보자는 간단하게 사용할 수 있는 Docker Desktop, Minikube를 주로 사용한다. 방법1. Docker Desktop으로 K8s 실행하는 방법: Docker Desktop 프로그램을 설치한 후, 설정 화면에서 단순히 Kubernetes를 활성화 시켜주면 쿠버네티스가 실행된다. (= 명령어 입력 없이 버튼 딸깍. 끝.) OS (Windows, Mac OS)에 맞춰 Docker Desktop을 설치한다. https://docs.docker.com/desktop..
기존의 ai 플랫폼의 문제점1. 리소스 관리가 비효율적이다. -> 한 연구팀이 GPU 리소스를 독점하고 있어, 다른 팀들이 실험을 진행하지 못한다. 2. 확장성에 제한이 있다. -> 대규모 모델 학습을 위해 수백 개의 GPU를 빠르게 확보하고 구성하는 것이 어렵다. 3. 비용 관리가 어렵다. -> 유휴 노드(ex. GPU)를 자동으로 해제하지 못해 불필요한 비용이 발생할 수 있다. 4. 하이브리드 클라우드 운영이 복잡하다. -> 클라우드와 온프레미스 환경을 동시에 사용할 때, 각 환경을 별도로 관리해야해서 운영 복잡도가 증가한다. 5. 워크플로우 관리가 어렵다. -> 데이터 전처리, 모델 훈련, 평가, 배포 등의 단계를 일관되게 관리하고 자동화하기 어렵다.6. 버전 관리..

아 한 시간 동안 내용 정리한 거 다 날아감 진짜 짜증난다; ㅠ Scalability & High Availability 스케일링 (Scalability)애플리케이션이나 시스템이 부하 증가에 따라 자원을 늘려 처리량을 견딜 수 있는 능력스케일링 종류:수직 스케일링 (Vertical Scaling)기존 인스턴스의 사양을 늘려 성능 향상 (예: t2.micro -> t2.large)하드웨어 제약으로 인해 한계가 있다. ex) DB 서버 (RDS, ElastiCache) 수평 스케일링 (Horizontal Scaling)인스턴스/시스템의 대수를 늘려 부하 분산 (클라우드 환경에서 흔히 사용 -> EC2 등의 클라우드 서비스 이용 시 쉽게 구현 가능)ex) 분산 시스템 (웹 애플리케이션)스케일링과 고가용성은 관..

이전 6장에서 인스턴스를 stop/terminate 상태가 아닌, hibernate 상태로 하면 이 후 다시 인스턴스를 시작했을 때 부팅 속도를 빠르게 하기위해 RAM 상태를 루트 EBS 볼륨에 저장한다고 했다. 7장에서는 EBS를 포함하여, 데이터를 저장하는 Instance Storage에 무엇이 있는지 알아보자. EBS VolumeEBS (Elastic Block Store) 볼륨은 인스턴스 실행하는 동안 연결할 수 있는 네트워크 드라이브이다.네트워크 드라이브: LAN, WAN을 통해 여러 컴퓨터에서 공유할 수 있는 저장 공간. USB를 컴퓨터가 연결하는 것과 비슷하게 네트워크 드라이브를 네트워크에 연결하면 여러 사용자가 동시에 접근, 작업할 수 있다. (ex, NAS, google drive)네트..

하 이전 5장 분량 진짜 겁나 김 ; 화 난 다. Private vs Public IP (IPv4)먼저 IP는 IPv4, IPv6이 있는데, 강의에서는 IPv4만 다룬다.IPv6은 주로 IoT에서 잘 쓰인다. IPv4는 약 37억개 주소를 갖는다. 위의 그림에서는 공용 IP, 사설 IP가 나온다.그림에서 알 수 있는 것은, 1. 공용 IP는 인터넷 전역에 액세스 가능하다.2. 사설 IP는 사설 네트워크 안에서만 액세스 가능하다. -> 인터넷 쓰려면 Internet Gateway 같은 것 필요함. Public IP인터넷 (WWW)에 접근 가능: 공용 IP는 인터넷에서 식별될 수 있다.고유성 : 전 세계적으로 모든기기의 공용 IP는 고유 해야함. 두 개의 기기가 동일한 공용 IP 가질 수 없음. 위치 추..

주변 사람들이 나만 빼고 쿠버네티스 얘기해서 소외감이 들었다. (놀 때는 기술 얘기 그만해...)나만 빼고 CKA를 따? 나만 빼고 홈서버를 사? (사실 관심 없었음)나만 빼고 해지뭴라고 ! 때마침 인턴 업무도 쿠버네티스 관련 업무여서(ㅠㅠ), 쿠버네티스 공부를 시작하게 되었다. 가보자고 (계속 공부해가면서 해당 포스팅은 계속 업데이트 될 예정입니다.)쿠버네티스의 등장전통적인 배포 시대 (Traditional Deployment)한 물리 서버에 애플리케이션을 배포(문제 상황) 한 물리 서버에서 여러 애플리케이션의 리소스 한계를 정의할 수 없는 리소스 할당 문제 -> (해결책) 서로 다른 물리 서버에서 각 애플리케이션을 실행 -> (또 다른 문제) 리소스를 충분히 활용하지 못하고, 여러 물리 서버를 유..

Budgets강의 들어가면서 예산(budgets) 설정하는 방법에 대해서도 나와서 간단히 정리해본다. AWS 서비스 이것저것 모르고 사용하다보면 과금 이슈가 많이 생겨서 조심해야하는데, 예산 설정 해두면 방지할 수 있다. 예산을 설정해두면 해당 예산이 거의 소진되었을 때 알람이 온다. 기본적으로는 루트 계정에서 설정 가능하고, 루트에서 권한 주면 사용자(관리자)도 예산 확인 가능하다. Amazon EC2란Elastic Conpute Cloud, InfraStructure as a ServiceAWS의 많은 서비스를 포함하고 있는데, virture machine을 빌려주고 (EC2)가상 드라이브에 데이터를 저장하고 (EBS)여러 머신에 부하를 분산하고 (ELB)서비스를 자동으로 스케일링한다. (ASG :..

IAM 이란?Identity and Access ManagementGlobel service이기 때문에 리전 상관없이 제공된다Root Account (루트 계정)이 있는데, 되도록 사용하지 말고 공유하지 말자.User들은 그룹으로 묶일 수 있으며,그룹에는 오직 User들만 포함된다. (그룹이 또 다른 그룹을 포함할 순 없다. )User는 2개 이상의 그룹에 포함될 수 있다.(multiple group)IAM : PermissionsUsers, Groups는 JSON 형태의 Policy(정책)를 부여받는다.Policy는 유저의 permission(권한)에 대해 정의한다. 유저에게 권한 부여할 때에는 최소한으로 부여한다. (least privilege principle -> 최소 권한 원칙)IAM: Poli..

그동안 프로젝트를 하며 AWS를 사용하여 애플리케이션을 배포한 경험은 있지만, 필요한 내용만 그때그때 채워나갔지 전문적으로 배워본 적은 없었다.그래서 공부할 겸 유데미 강의를 병행하며 AWS SAA-C03 시험을 준비하려 한다.가보자고.AWS란?Amazon Web Services 의 줄임말On demand(온디멘드) 방식으로 확장성 있음 ( 온프레미스는 확장성 x)넷플릭스는 단 하나의 서버도 온프레미스가 아니고 aws를 사용하기에 확장성 좋음.AWS는 스파게티 같다 -> 왜? 수 많은 서비스가 다 연관되어 있기 때문! (ㅇㅈ)AWS cloud history2002년에 시작해서2004년에 SQS 런칭2006년에 SQS, S3, EC2 런칭2007년에 유럽에도 런칭이 후에 Dropbox, netflix, a..

https://yejin-code.tistory.com/49 MLOps 개념 정리MLOps란?머신 러닝 (Machine Learning)과 운영(Operations)를 합친 용어로 프로덕션 환경에서 머신 러닝 모델이 지속적, 안정적으로 배포되도록 유지, 관리, 모니터링 하기 위한 문화, 방법론즉, MLOps는 머yejin-code.tistory.com (위의 내용을 먼저 읽으시는 것을 추천드립니다. ) MLOps가 왜 필요하며 어떤 요소들이 있는 지 보면서 '오 이거 좋네 ~' 라고 생각하셨다면, 이제 직접 사용 해보면 좋겠죠?(그렇다고 해주세요) 궁금하실테니 MLOps를 적용하기 위한 기술에 뭐가 있는지도 살펴보겠습니다 ! AI 플랫폼이란? AI 플랫폼은 ML 워크플로우를 자동화해줍니다. ML 워크플로..