Tag | Data Study

사례기반추론(Case-Based Reasoning, CBR)개념 과거의 사례들의 결과를 바탕으로 새로운 사례 결과를 예측하는 방법 굉장히 간단하지만, 유용성이 매우크다. 과거 사례들을 저장해 둔 사례 기반으로부터 해결하고자 하는 새로운 사례와 가장 유사한 사례를 검색한...

군집분석 이론

2022-03-24 3 분 소요

대상을 분류 함에 있어 여러 질적변수로 분류 하는 것은 쉽지만, 양적변수로 분류 하는 것은 쉽지 않다. 이러한 상황에서 자유롭게 이용되는 기법이 군집분석이라 할 수 있다.

군집분석 예제 - 1

2022-03-24 2 분 소요

K-means Clustering Method 방법을 활용한 군집 분석 사례 (간단분석)

맨 위로 이동 ↑

통계 R

R 산점도 visualization

2022-03-30 2 분 소요

산점도에 대한 시각화 표현을 해본다.

R ggplot visualization 표현

2022-03-30 최대 1 분 소요

ggplot 그래프를 그리기 위한 코드는 그래프 틀을 정해주는 ggplot 함수와 그래프 형태를 정해주는 함수가 추가로 붙게 되며, 레이어 추가방식 + 를 통해서 계속 지정이 가능하다.

R 정규분포 Visualization 표현

2022-03-30 6 분 소요

다양한 평균,분산에 따른 정규분포 비교 > m = 0 > std = 1 > x <- seq((m-5*std),(m+5*std), length=101 ) # Y <- (1/sqrt(2*pi))*exp(-X^2/2) 정규분포 함수를 직접 활용해도 됨 >...

R igraph 네트워크 자료의 표현 - 2

2022-03-26 3 분 소요

igraph 네트워크 객체로 표현하면 노드속성과 엣지속성을 표현하는데 장점이 많다.

R 네트워크 자료의 표현 - 1

2022-03-26 1 분 소요

네트워크 표현형식은 아래와 같이 2가지로 표현이 가능하다.

R 데이터 결합함수(cbind, rbind, merge)

2022-03-14 2 분 소요

분석시 데이터의 프레임을 결합하는 경우가 꽤 발생한다. R은 이 기능을 충분히 제공하고 있으며 이 함수에 대해서 정리를 한다.

R apply, lapply, sapply, tapply, by 함수 정리

2022-03-14 7 분 소요

apply 계열 함수는 array, data frame, vector 등 에 대해 함수를 적용하는 경우에 편리하게 사용하는 함수 이다. 통상 각데이터 연산을 할때 for문을 사용하는 것 보다 빠르게 연산을 한다.

맨 위로 이동 ↑

통계자료

통계 수량형 자료의 표현

2022-03-15 1 분 소요

자료의 표현 및 Data Visualization

R 데이터 결합함수(cbind, rbind, merge)

2022-03-14 2 분 소요

분석시 데이터의 프레임을 결합하는 경우가 꽤 발생한다. R은 이 기능을 충분히 제공하고 있으며 이 함수에 대해서 정리를 한다.

R apply, lapply, sapply, tapply, by 함수 정리

2022-03-14 7 분 소요

apply 계열 함수는 array, data frame, vector 등 에 대해 함수를 적용하는 경우에 편리하게 사용하는 함수 이다. 통상 각데이터 연산을 할때 for문을 사용하는 것 보다 빠르게 연산을 한다.

통계R 자료구조와 연산

2022-03-14 8 분 소요

Vector, Matrix, Dataframe, Array, List 의 연산과 데이터 접근법 등을 알아본다.

통계R 벡터연산 및 자료형

2022-03-14 7 분 소요

R의 변수 및 데이터구조

통계자료의 종류

2022-03-13 최대 1 분 소요

통계의 자료는 측정도구 등에 따라 달라지고 그 분류에 따라 처리 방식이 달라 진다.

맨 위로 이동 ↑

텍스트마이닝

텍스트 전처리

2022-08-02 7 분 소요

토큰화

텍스트마이닝 이론

2022-03-25 1 분 소요

개념 인간의 언어로 이루어진 비정형 텍스트 데이터들을 자연어 처리(Natural Language Processing)방식을 이용하여 대규모 문서에서 정보 추출, 연계성 파악, 분류 및 군집화, 요약 등을 통해 데이터에 숨겨진 의미를 발견하는 기법

텍스트마이닝 예제 (R을 활용) - 3

2022-03-25 1 분 소요

텍스트 마이닝 분석 이후 연관분석 까지 실시해서 분석 해본다.

텍스트마이닝 예제 (R을 활용) - 2

2022-03-25 최대 1 분 소요

국문에 대해 간단한 텍스트 마이닝을 통해 워드 클라우드를 만드는 예제

텍스트마이닝 예제 (R을 활용) - 1

2022-03-25 1 분 소요

영문에 대해 간단한 텍스트 마이닝을 통해 워드 클라우드를 만드는 예제

맨 위로 이동 ↑

Python

Python 객체지향

2022-03-13 3 분 소요

객체지향 프로그래밍 (OOP : Object Oriented Programming) 프로그램을 명령어의 나열로 보는 시각에서 벗어나 여러 개의 독립된 단위인 “객체”들의 모임으로 파악하는 것으로 클래스, 속성, 메서드로 구성을 이루고 있다. 객체지향은 캡슐화(Encapsu...

Python 흐름제어, 함수

2022-03-13 최대 1 분 소요

선택적흐름 과 반복적 흐름

Python 식별자와 연산자

2022-03-13 최대 1 분 소요

식별자

Python 데이터 타입

2022-03-13 최대 1 분 소요

기본자료형 (정수,실수,복소수,논리형,문자열)

맨 위로 이동 ↑

R

통계 수량형 자료의 표현

2022-03-15 1 분 소요

자료의 표현 및 Data Visualization

통계R DataFrame

2022-03-14 3 분 소요

많이 활용되는 DataFrame의 조작 방법을 알아본다.

통계R 자료구조와 연산

2022-03-14 8 분 소요

Vector, Matrix, Dataframe, Array, List 의 연산과 데이터 접근법 등을 알아본다.

통계R 벡터연산 및 자료형

2022-03-14 7 분 소요

R의 변수 및 데이터구조

맨 위로 이동 ↑

Hadoop

Hadoop MapReduce 소개 및 실습

2022-07-19 최대 1 분 소요

MapReduce 설계 특성 분산 컴퓨팅에 적합한 분산 프로그래밍 모델 Map과 Reduce함수를 합친말 Map은 분산되어 있는 데이터를 연관성있는 데이터들로 분류하는 작업 Reduce 원하는 데이터를 추출하는 작업 Data Locality를 최대한 활용 F...

Hadoop HDFS 소개 및 실습

2022-07-19 최대 1 분 소요

HDFS의 설계 대용량 데이터 저장 : 하나의 파일이 terabyte, petabyte이상의 사이즈로 저장 장애복구 : 장애를 신속하게 감지하고 대처할 수 있도록 설계 데이터의 무결성 : 한번 저장된 데이터를 수정 할 수 없고 읽기만 가능하게 해서 데이터 무결정을 유지

Hadoop 실습

2022-07-19 최대 1 분 소요

실습환경 여러 하둡을 패키지로 묶어놓은 것 : HDP(Hortonworks Sandbox) Virtural Box

Hadoop 소개

2022-07-19 2 분 소요

Hadoop 소개 하둡은 빅데이터를 분산,저장,처리 할 수 있는 자바기반의 오픈소스 프레임워크 기존의 OLTP(실시간 처리를 위한 데이터 베이스)용 데이터베이스에서 발생하는 문제를 해결 3V (Volumn, Velocity, Variety)의 문제 큰데이터를 저렴한...

맨 위로 이동 ↑

ai

연관성분석 예제(1)

2022-03-15 2 분 소요

분석개요

연관성분석 transactions class

2022-03-13 1 분 소요

연관성 분석에 사용되는 데이터 유형은 idi형태가 아닌 itl 형태의 데이타가 사용된다.

연관성분석 이론

2022-03-13 2 분 소요

연관성분석은 장바구니분석(Market Basket Analysis) 또는 서열분석(Sequence Analysis) 이라고도 한다 기업의 데이터에서 상품구매, 서비스 등 일련의 거래 또는 사건들 간의 규칙을 발견 할 목적으로 사용된다. 주요 응용은 Market basket anal...

맨 위로 이동 ↑

big Data

연관성분석 예제(1)

2022-03-15 2 분 소요

분석개요

연관성분석 transactions class

2022-03-13 1 분 소요

연관성 분석에 사용되는 데이터 유형은 idi형태가 아닌 itl 형태의 데이타가 사용된다.

연관성분석 이론

2022-03-13 2 분 소요

연관성분석은 장바구니분석(Market Basket Analysis) 또는 서열분석(Sequence Analysis) 이라고도 한다 기업의 데이터에서 상품구매, 서비스 등 일련의 거래 또는 사건들 간의 규칙을 발견 할 목적으로 사용된다. 주요 응용은 Market basket anal...

맨 위로 이동 ↑

통계분석

연관성분석 예제(1)

2022-03-15 2 분 소요

분석개요

연관성분석 transactions class

2022-03-13 1 분 소요

연관성 분석에 사용되는 데이터 유형은 idi형태가 아닌 itl 형태의 데이타가 사용된다.

연관성분석 이론

2022-03-13 2 분 소요

연관성분석은 장바구니분석(Market Basket Analysis) 또는 서열분석(Sequence Analysis) 이라고도 한다 기업의 데이터에서 상품구매, 서비스 등 일련의 거래 또는 사건들 간의 규칙을 발견 할 목적으로 사용된다. 주요 응용은 Market basket anal...

맨 위로 이동 ↑

인공지능

의사결정나무 이론

2022-03-23 3 분 소요

의사결정 나무는 간단하게 말해 if~else와 같이 특정 조건을 기준으로 O/X로 나누어 분류/회귀를 진행하는 tree 구조의 분류/회귀 데이터마이닝 기법이다.

의사결정나무 분석절차 및 R 패키지

2022-03-23 1 분 소요

1. 의사결정나무 분석절차

의사결정나무 분석사례 - 1

2022-03-23 2 분 소요

A. 데이터 준비

맨 위로 이동 ↑

의사결정나무

의사결정나무 이론

2022-03-23 3 분 소요

의사결정 나무는 간단하게 말해 if~else와 같이 특정 조건을 기준으로 O/X로 나누어 분류/회귀를 진행하는 tree 구조의 분류/회귀 데이터마이닝 기법이다.

의사결정나무 분석절차 및 R 패키지

2022-03-23 1 분 소요

1. 의사결정나무 분석절차

의사결정나무 분석사례 - 1

2022-03-23 2 분 소요

A. 데이터 준비

맨 위로 이동 ↑

클라우드 컴퓨팅

AWS 서비스 소개

2022-07-18 1 분 소요

빅데이터를 위한 AWS 서비스

클라우드 컴퓨팅 기초(AWS)

2022-07-18 1 분 소요

클라우드 컴퓨팅 분류

클라우드 컴퓨팅 개념

2022-07-17 1 분 소요

클라우드 컴퓨팅은 현재 가장 Hot 기술로, 기업의 사업본질의 집중과 효율성 극대화를 위해 도입

맨 위로 이동 ↑

AWS

AWS 서비스 소개

2022-07-18 1 분 소요

빅데이터를 위한 AWS 서비스

클라우드 컴퓨팅 기초(AWS)

2022-07-18 1 분 소요

클라우드 컴퓨팅 분류

EC2 및 Nginx 설치

2022-07-18 최대 1 분 소요

EC2 서비스 생성 실습

맨 위로 이동 ↑

electron

electron 에서 sqlite3설치후 Cannot find module node_sqlite3.node 오류 발생시 해결 방법

2022-08-26 최대 1 분 소요

Electron Vue 환경에서 sqlite3 설치시 다음과 같은 에러가 발생하는 경우가 있다.

fs.readFileSync, readFile 사용 (electron , Vue)

2022-08-05 최대 1 분 소요

Electron Vue 환경에서 fs.readFileSync, readFile 사용하는 경우 보안문제로 인하여 다음과 같은 에러가 발생한다.

ApexCharts 모듈 사용 (electron , Vue)

2022-08-05 1 분 소요

ApexCharts 이란 ? Chart를 그리는 라이브러리로 Vue, React 등 다양한 환경에 사용 가능한 라이브러임

맨 위로 이동 ↑

확률의 기초이론

확률의 기초이론 - 2

2022-03-11 최대 1 분 소요

조건부 확률

확률의 기초이론 - 1

2022-03-11 1 분 소요

확률의 기본개념

맨 위로 이동 ↑

확률

확률의 곱셈정리

2022-03-13 2 분 소요

곱셈정리 개요

통계자료의 종류

2022-03-13 최대 1 분 소요

통계의 자료는 측정도구 등에 따라 달라지고 그 분류에 따라 처리 방식이 달라 진다.

맨 위로 이동 ↑

R 함수

R 데이터 결합함수(cbind, rbind, merge)

2022-03-14 2 분 소요

분석시 데이터의 프레임을 결합하는 경우가 꽤 발생한다. R은 이 기능을 충분히 제공하고 있으며 이 함수에 대해서 정리를 한다.

R apply, lapply, sapply, tapply, by 함수 정리

2022-03-14 7 분 소요

apply 계열 함수는 array, data frame, vector 등 에 대해 함수를 적용하는 경우에 편리하게 사용하는 함수 이다. 통상 각데이터 연산을 할때 for문을 사용하는 것 보다 빠르게 연산을 한다.

맨 위로 이동 ↑

경험의 법칙

통계 심슨의역설(Simpson’s Paradox)

2022-03-16 2 분 소요

개념 심슨의 역설은 데이터의 상세 그룹에서 나타나는 평균, 추세 등과 이를 전체 그룹화 시켜서 평균, 추세 등을 비교 해보면 서로 상반되거나 다른 결론에 이룰 수 있다는 역설이다. 좀 더 간단하게 표현해 보자면

통계 경험의법칙(chebishev’s Rule & Emprical)

2022-03-16 1 분 소요

chebishev’s Rule 체비셔프 부등식 : $P(| x- \mu | < k \sigma) = P[\mu -k \sigma < x < \mu +k \sigma] \geq 1 - \frac{1}{k^2}$ chebishev’s Rule에 의하면, ...

맨 위로 이동 ↑

chebishev's Rule

통계 심슨의역설(Simpson’s Paradox)

2022-03-16 2 분 소요

개념 심슨의 역설은 데이터의 상세 그룹에서 나타나는 평균, 추세 등과 이를 전체 그룹화 시켜서 평균, 추세 등을 비교 해보면 서로 상반되거나 다른 결론에 이룰 수 있다는 역설이다. 좀 더 간단하게 표현해 보자면

통계 경험의법칙(chebishev’s Rule & Emprical)

2022-03-16 1 분 소요

chebishev’s Rule 체비셔프 부등식 : $P(| x- \mu | < k \sigma) = P[\mu -k \sigma < x < \mu +k \sigma] \geq 1 - \frac{1}{k^2}$ chebishev’s Rule에 의하면, ...

맨 위로 이동 ↑

사례기반추론 예제

사례기반추론 예제 - 2

2022-03-24 2 분 소요

간단한 예제를 R을 통하여 알아본다

사례기반추론 예제 - 1

2022-03-24 3 분 소요

간단한 예제를 R을 통하여 알아본다

맨 위로 이동 ↑

네트워크 자료

R igraph 네트워크 자료의 표현 - 2

2022-03-26 3 분 소요

igraph 네트워크 객체로 표현하면 노드속성과 엣지속성을 표현하는데 장점이 많다.

R 네트워크 자료의 표현 - 1

2022-03-26 1 분 소요

네트워크 표현형식은 아래와 같이 2가지로 표현이 가능하다.

맨 위로 이동 ↑

정규분포 표현

R ggplot visualization 표현

2022-03-30 최대 1 분 소요

ggplot 그래프를 그리기 위한 코드는 그래프 틀을 정해주는 ggplot 함수와 그래프 형태를 정해주는 함수가 추가로 붙게 되며, 레이어 추가방식 + 를 통해서 계속 지정이 가능하다.

R 정규분포 Visualization 표현

2022-03-30 6 분 소요

다양한 평균,분산에 따른 정규분포 비교 > m = 0 > std = 1 > x <- seq((m-5*std),(m+5*std), length=101 ) # Y <- (1/sqrt(2*pi))*exp(-X^2/2) 정규분포 함수를 직접 활용해도 됨 >...

맨 위로 이동 ↑

EMR

EMR 개요

2022-07-19 최대 1 분 소요

EMR(Elastic MapReduce) Managed Hadoop Spark, Hbase, Hive 등도 포함 내부적으로 EC2 인스턴스를 활용 다른 AWS 서비스들과 통합가능(S3)

EMR 클러스터 생성 및 Hive 사용

2022-07-19 최대 1 분 소요

EMR클러스터 생성

맨 위로 이동 ↑

ApexCharts

fs.readFileSync, readFile 사용 (electron , Vue)

2022-08-05 최대 1 분 소요

Electron Vue 환경에서 fs.readFileSync, readFile 사용하는 경우 보안문제로 인하여 다음과 같은 에러가 발생한다.

ApexCharts 모듈 사용 (electron , Vue)

2022-08-05 1 분 소요

ApexCharts 이란 ? Chart를 그리는 라이브러리로 Vue, React 등 다양한 환경에 사용 가능한 라이브러임

맨 위로 이동 ↑

Vue

fs.readFileSync, readFile 사용 (electron , Vue)

2022-08-05 최대 1 분 소요

Electron Vue 환경에서 fs.readFileSync, readFile 사용하는 경우 보안문제로 인하여 다음과 같은 에러가 발생한다.

통계 범주형 자료의 표현

2022-03-15 최대 1 분 소요

범주형 자료의 표현 방법

맨 위로 이동 ↑

막대그래프

통계 범주형 자료의 표현

2022-03-15 최대 1 분 소요

연속형 확률분포 Ⅰ(정규분포)

2022-03-18 2 분 소요

R 산점도 visualization

2022-03-30 2 분 소요