본문 바로가기
머신러닝) 머신러닝 알고리즘 - 군집화 (k-means) ≣ 목차 군집화 알고리즘군집화란?유사도가 높은 집단끼리 그룹을 만들고, 분류된 그룹 간 특징을 파악하는 분석 방법정답이 없는 `비지도 학습` 군집화 알고리즘의 종류k-means (k-평균)주어진 데이터를 k개의 클러스터로 묶는 알고리즘label이 없는 데이터를 입력받아 각 데이터에 labe을 할당함으로써 군집화를 수행함가장 많이 쓰이며 실행 속도가 빠름군집의 중점 개수를 `k개`로 미리 설정해야 함.이때 최적의 k 값을 찾기 위한 방법 : `엘보우 기법`엘보우 기법이란, 클러스터의 중점과 각 데이터 간의 거리를 기반으로 계산해 적절한 k의 값을 찾는 방법 * `inertia(이너셔)`: 각 그룹에서의 중심과 각 그룹에 해당하는 데이터 간의 거리에 대한 합- 이너셔 확인 메소드 `kmeans_model.i.. 2025. 1. 24.
머신러닝) 머신러닝 프로세스와 종류 ≣ 목차 머신러닝의 절차머신러닝이란?대량의 데이터를 활용해, 컴퓨터(기계) 스스로 학습해 가는 방법 = 머신러닝데이터를 던져주고 '데이터의 어떤 특징에 주목해서 학습하라'고 지시하면 기계가 스스로 학습함.많은 데이터로 학습한 뒤, 새로운 데이터에 대한 예측 모델을 만드는 것이 목적임응용 방법) `딥러닝` 이란?머신러닝의 여러 방법 중 하나임 인간이 '어떤 특징에 주목해 학습하라'고 지시하지 않아도, 기계가 스스로 특징을 찾아내는 것 절차 1. 데이터를 수집한다.데이터 수집은 크롤링, 센서 활용, 로그 활용, 기존 데이터 활용 등 이용2. 데이터를 전처리한다.이상치, 결측치 등을 수정 및 정리하고 기존 데이터들을 활용해 데이터를 추가로 만들어내는 과정3. 모델을 학습시킨다. 준비된 데이터를 머신러닝 알고리.. 2025. 1. 22.
구글 빅쿼리에 데이터 업로드 / Github 이용하기 ≣ 목차 구글 빅쿼리Google이 제공하는 머신러닝, 지리정보 분석, 비즈니스 인텔리전스와 같은 서비스를 제공함이러한 서비스로 데이터를 관리하여 분석할 수 있게 해주는 데이터 웨어하우스프로젝트 시 장점: 모두 공통된 데이터를 볼 수 있음구글의 Colab, 스프레드시트 등 호환성 뛰어남코랩에서 빅쿼리 연동구글 빅쿼리 - 프로젝트 생성 & 인증키 발급하기메인화면 좌측상단 프로젝트 클릭 - 새 프로젝트 생성서비스 목록IAM 및 관리자: 프로젝트의 권한을 관리, 사용자 초대 등Compute Engine: 서버 관리Bigquery: 데이터웨어하우스API 및 서비스: 빅쿼리 데이터 전송에 대한 옵션 빅쿼리 API 설정외부에서 빅쿼리에 API로 접근할 수 있도록 API 및 서비스 -> 사용자 인증 정보 만들기 -> .. 2025. 1. 21.
4차 QCC review ≣ 목차 ✏️ 1번 문제`store` 테이블 이용지역별로 매출이 가장 높은 매장의 매출을 조회해당 지역에 매장이 2개 이상인 경우만 결과에 포함결과는 지역이름 기준으로 오름차순 풀이SELECT region_name, max(sales) as highest_salesfrom stores s group by 1having count(distinct store_id) > 1order by 1;  ✏️ 2번 문제`payments` `orders` 테이블 이용다음 조건에 해당되는 사용자 수를 출력결제를 하지 않고 상품을 주문한 사용자첫 번째 결제일보다 이전에 상품을 주문한 사용자 풀이WITH first_payment AS ( SELECT USER_ID, MIN(PAY_DATE).. 2025. 1. 16.
통계) 1종오류, 2종오류, 검정력 ≣ 목차 가설에 따른 오류 발생1종 오류 & 2종 오류 `1종 오류` : 귀무가설이 맞는데 틀리다고 함 (대립가설 채택)`2종 오류` : 귀무가설이 틀린데 맞다고 함 (귀무가설 채택)-> 1,2종 오류를 모두 관리할 수 없음.     보통 1종 오류가 더 위험하니 유의수준(α)로 관리한다.   검정력 1-β1-β : 옳게 판단할 영역 = `검정력`귀무가설이 틀렸을 때, 귀무가설을 기각시킬 확률2종오류가 최소일 때, 가장 커진다. 2025. 1. 16.
맥북 파일경로, 위치 복사 단축키 (csv 파일 불러오기) vs code에서 csv 파일 불러올 때, 파일 경로 복사하기 Command + Option + C-> 파일 클릭하고 단축키 쓰면 경로 복사됨 2025. 1. 14.