데이터 사이언스는 차근차근

전체 글 14

2-2. Pytorch 튜토리얼_사칙연산과 Broadcast

[Pytorch 사칙연산]Tensor끼리의 사칙연산Tensor끼리의 사칙연산은 python의 문법과 동일하며 행렬의 계산과 동일하게 적용됨 Inplace Operationprint(a)print(a.mul(b))print(a)print(a.mul_(b)) # a에 a.mul(b)를 덮어씌움(기존에 있는 메모리에 할당) -- _를 붙임print(a)tensor([[1., 2.], [3., 4.]])tensor([[ 2., 4.], [ 9., 12.]])tensor([[1., 2.], [3., 4.]])tensor([[ 2., 4.], [ 9., 12.]])tensor([[ 2., 4.], [ 9., 12.]]) Sum, Mean (Dime..

"2030년까지 AI 훈련 컴퓨팅 1만배 증가...병목 현상 올 때까지 AI 극적으로 발전할 것"

[뤼튼을 사용하여 아래의 기사를 요약하였습니다]- **컴퓨팅 파워 요구 사항**:    - 미래의 AI 모델은 GPT-4의 50,000배에 달하는 컴퓨팅 인프라를 필요로 할 것으로 예상된다. 이는 강력한 칩의 필요성을 강조한다. - **AI 훈련 데이터 문제**:   - 전문가들 사이에서 AI 훈련 데이터의 가용성에 대한 의견이 엇갈린다. 일부는 2년 내에 데이터 부족이 발생할 것이라고 예측하고, 다른 이들은 2030년까지 큰 문제는 없을 것이라고 주장한다. 법적 분쟁이 데이터 공급에 즉각적인 영향을 미치지 않을 것이라는 점도 언급된다. 다중 모달 및 합성 데이터의 증가가 실용적인 해결책으로 강조된다. - **모델 훈련 시간**:   - AI 알고리즘의 크기가 훈련 기간에 직접적인 영향을 미치며, 이는 ..

AI News 2024.09.24

오픈AI 새로운 AI 모델 'o1(오원)' 공개

o1의 가장 큰 특징은 문제 해결 과정에서 인간과 유사한 사고 과정을 모방한다는 점이다. 마치 사람처럼 대답하기 전에 생각하고 문제를 분석하고, 단순한 구성 요소로 분해하며, 전략을 세우고, 실수를 수정하는 과정을 거쳐 복잡한 문제에 대한 해답을 찾아낸다. 이 모델은 범용일반지능(Artificial general intelligence) 시대로의 새로운 국면을 연 것이다.o1의 또 다른 특징은 숨겨진 추론 과정이다. 사용자에게는 보이지 않지만, 개발자는 이 내부 추론 과정을 모니터링하여 모델의 사고 패턴을 분석하고 안전성을 확보할 수 있다. 오픈AI는 이러한 접근 방식이 사용자 경험, 경쟁 우위, 향후 안전 모니터링 가능성 사이의 균형을 유지하는 데 도움이 될 것이라고 밝혔다.출처 : 인공지능신문(htt..

AI News 2024.09.19

2-1. Pytorch 튜토리얼_Pytorch 설치와 Tensor 생성

[왜 Pytorch인가?] - Numpy와 비슷한 문법 - 동적으로 back-propagation 경로 생성 가능 [Pytorch 설치 방법]① pytorch.org 접속 - get started 클릭② 학습자의 분석 환경에 맞는 옵션을 클릭하고 'Run this Command'를 프롬프트 창에 복붙해서 설치!     (나는 anaconda 가상환경을 사용해서 학습할 예정이므로, conda prompt에 복붙해서 설치했다)   [Tensor란?]Tensor의 형태- k,n,m의 순서가 헷갈리지 않도록 외우기! -- 시각화 할 때 편리함! (높이-가로-세로)- 2차원(matrix)일 경우 높이(k)-가로(n)의 순서- Tabular data도 2차원의 형태로 표현- Mini-batch: parallel하게..

1. 딥러닝 Overview

[Introduction]                                                                                                                                                                          딥러닝이란? - Deep Nueral Networks(DNN)을 학습시켜 문제를 해결 하는 것 - 인공신경망(Artificial Neural Networks)의 적통을 이어받음    * Neuron들로 구성된 신경망을 학습하여 문제를 해결하도록 동작하는 함수 - 기존 신경망 대비 더 깊은 구조를 갖는 것이 특징 왜 딥러닝인가? - 비선형 함수로 기존 머신러닝 대비 패턴 인식 능력이..

[Udemy 태블로 강의] Sec.3_시계열, 어그리게이션 및 필터

[시계열 작업하기] period를 월 기준으로 바꾸면, 년도와 상관없이 1~12월중 해당되는 월로 카테고리화되어 의미 없는 그래프가 생성됨. 아래쪽 월 클릭하면 timeline형식으로 설정 가능! >>시계열(time series)을 다룰 때, 데이터를 치수(Dimetion)나 값(Measure) 또는 카테고리 중 무엇으로 만들고 싶은지 정확하게 파악해야 함! [Aggregation(집합) , Granularity(세분화)] >>색상을 통해 성별의 집합 구분 가능 >>색상, 모양에 영향을 주지 않고 상세한 정보를 추가하고 싶을때 세부정보 사용 [영역차트(Area Chart)만들기 & 강조표시] >> 범례 클릭하여 한 성별그룹 강조 >> Age를 모양에 넣고 '선택된 항목 하이라이트' 클릭하여 한 연령그룹만..

[Udemy 태블로 강의] Sec.2_첫번째 막대 차트

데이터는 항상 치수(dimensions)와 값(measures)으로 나뉨 보통 태블로는 값을 두개 이상의 치수에 넣어서 이들을 카테고리화 하고 작업물의 질을 높임. * 치수 : 독립적인 값 * 값 : 종속적인 값 (지역에 따른 매출 -> 치수:지역/값:매출) [누가 보너스를 갖고 갈까?] - 상위 3개 지역에서 가장 높은 판매고를 올린 직원이 보너스 수령 * 계산된 필드 만들기를 통해 새로운 값 생성! * 색상 ctrl+드래그 -> 복사~ * 축과 레이블 * 내보내기 이미지 : 우클릭 복사 (범례 설정 가능) 태블로 퍼블릭은 안됨ㅎㅎ;