1주차 정리
이번 주에는 Excel에 대해 더 자세히 알아보고 효율성을 높이는 데 도움이 되는 많은 유용한 팁과 요령을 발견했다.
1.기본 수식(SUM, AVERAGE, COUNT)
기본 공식을 사용하는 방법을 배우면 계산 속도를 높이고 오류를 줄일 수 있다.
SUM: 숫자 범위를 더한다.
ex) 셀 A1에서 A5까지의 판매량을 더하려면 '=SUM(A1:A5)' 수식을 사용하세요.
A1에 100, A2에 150, A3에 200, A4에 250, A5에 300이 있는 경우 =SUM(A1:A5)의 결과는 1000이 된다.
평균: 숫자 범위의 평균을 계산한다.
ex) 셀 B1부터 B5까지 클래스의 평균 점수를 계산하려면 =AVERAGE(B1:B5)를 사용한다.
B1부터 B5까지의 점수가 75, 80, 85, 90, 95인 경우 =AVERAGE(B1:B5)의 결과는 85가 된다.
COUNT: 숫자가 포함된 범위에서 셀 수를 계산한다.
ex) C1~C6 셀에 나열된 매출 항목 수를 계산하려면 '=COUNT(C1:C6)'를 사용하세요.
C1, C2, C3에 숫자가 포함되어 있고 C4, C5, C6이 비어 있는 경우 =COUNT(C1:C6)의 결과는 3이 된다.
2. 셀 참조(상대 및 절대)
수식을 정확하게 복사하려면 상대 참조와 절대 참조의 차이점을 이해하는 것이 중요하다.
함수 종류
countA -> 데이터가 있는 셀 모두 포함 (A=All)
countblank: 비어있는 셀 개수
countif(C5:C12,"A") // (범위,"조건")
countifs (J55:J62,">5", J55:J62,"<8") //(범위,"조건".범위,"조건")
IF 절함 수는 (logical_test, TRUE, FALSE)
IF -> N+1 결괏값
VLOOKUP(찾을 기준 데이터, 데이터 범위, 해당 열, 0 or 1) ※ 0(FALSE) : 정확한 값, 1(TRUE) : 근사치 (대부분 0 사용)
ex) VLOOKUP(D5, 직원 정보 LIST! $D:$J, 3,0 )
Match (찾고 싶은 값, 범위, 0)
Index (데이터의 전체 범위, 찾으려는 행 번호, 찾으려는 열 번호)
Sumif (더할 조건 범위, "조건", 더할 값들의 조건 해당되는 범위)
Sumifs(더할 값들의 조건 해당되는 범위, 더할 조건 범위-1, 조건-1, ,더할 조건 범위-2, 조건-2)
Sumproduct -> (인수 곱셈) 배열의 곱 합계
ex) Sumproduct (C9:C10)(곱할 값 범위 1)(곱할 값 범위 2) ※ (C9:C10) = 1 or 0
텍스트를 찾는 함수 Find 함수 (대소문자 구분) , search 함수 (대소문자 구분 x)
날짜 함수
날짜 데이터 계산 (종료일-시작일=기간 / 종료일은 기간에서 제외됨 / 종료일 포함하려면 +1)
Find 함수
ex) =FIND("-",B5,1)
"-" 찾기, B5 셀에서, 1글자부터 시작
LEFT / RIGHT 함수
ex) =LEFT(B6,FIND("-",B6,1)-1)
왼쪽에서 B6 셀에서 "-"찾기 B6셀에서 1글자부터 시작 글자수 -1
ex)=RIGHT(B5,LEN(B5)-E5)
오른쪽 B5셀, B5셀의 카운트 - E5셀의 카운트
MID 함수
=MID(B5,5,3)
B5셀,5글자부터 Start, 3글자 추출
※실습 07 (실습07) LEFT_RIGHT_MID_LEN 함수로 데이터 추출하기 참조
다양한 조작 키
- Tab 키 -> ( ) 함수 생성
- Ctrl + 9 -> 행 숨기기
- Ctrl + Shift + 9 -> 행 표시
- Ctrl + 0 -> 열 숨기기
- Alt + t -> 틀 고정
- Alt + D + F + F -> 필터 단축키
2. 참조
상대 참조: 수식이 새 위치에 복사되면 변경된다.
ex) C1 셀에 '=A1+B1'을 입력한 다음 C2에 복사하면 수식이 자동으로 '=A2+B2'로 변경된다.
절대 참조: 수식을 복사할 때 참조는 고정된 상태로 유지된다(달러 기호 $로 표시됨). (F4 키 1번)
ex) C1 셀에 =$A$1+$B$1을 사용하여 C2에 복사하면 수식은 A2와 B2가 아닌 A1과 B1을 참조
혼합 참조 (자주 쓰임) (F4키 활용)
ex)
$A1: 열(A)을 잠그지만 행(1)은 변경할 수 있다.
A$1: 행(1)을 잠그지만 열(A)은 변경할 수 있다.
$A$1: 행과 열을 모두 잠급니다(절대 참조).
3. 사용자 지정 기호
기호
|
의미
|
예시
|
#
|
숫자의 대표 값(의미 없는 0은 생략)
|
001 → ### → 1
0 → # → (빈칸)
|
0
|
숫자의 대표 값(의미 없는 0도 표시)
|
001 → 000 →001
0 → 0 →
|
@
|
문자의 대표 값
|
고객 → @"님" -> 고객님
|
,
|
숫자의 중간: 1000단위 마다 쉼표
숫자의 끝: 1000단위 반올림
|
1000500 → #,##0 → 1000,500
1000500 → #,##0, → 1,001
|
4. 조건부 서식
조건부 서식은 내용에 따라 셀 형식을 자동으로 변경하므로 추세를 더 쉽게 파악할 수 있다.
ex) 판매 열에서 $1000 이상의 값이 있는 셀을 강조 표시하려는 경우:
매출 항목을 선택하세요.
홈 > 조건부 서식 > 셀 규칙 강조 표시 > 다음보다 큼으로 이동
값을 '1000'으로 설정하면 Excel은 선택한 범위에서 $1000가 넘는 매출을 강조 표시
5. 기본 차트 및 그래프
차트와 그래프는 데이터를 시각화하고 보다 이해하기 쉬운 방식으로 표현하는 데 필수적이다.
ex) 다양한 지역의 매출을 비교하는 막대 차트를 생성하려면 다음을 수행하세요.
데이터를 선택하세요(A 열의 지역, B 열의 매출).
삽입 > 차트 > 막대 차트로 이동하여 스타일(예: 묶은 막대)을 선택
Excel은 각 지역의 매출을 보여주는 막대 차트를 생성
선 차트는 월별 판매량 등 시간 경과에 따른 추세를 추적하는 데 사용할 수 있다.
6. 결측치와 이상치
결측치: 데이터에 값이 없는 것
ex)
-NA : Not Available (유효하지 않은)
-NaN : Not a Number (숫자가 아닌)
-Null : 아무것도 존재하지 않음을 의미
-빈 칸: 데이터가 입력되지 않음
이상치: 특정 지정된 그룹에 분류되지 못하는 값으로, 정상군의 상한과 하한의 범위를 벗어나 있어나 패턴에서 벗어난 수치
→ 일반적으로 -3σ(표준편차) 미만, +3σ 초과인 값을 이상치로 판정
IQR = 3Q - 1Q (1사분위수와 3사분위수 간의 거리 = 3사분위수 - 1사분위수)
IQR을 통해 알수 있는 이상치 범위는 다음과 같다.
이상치 < 1Q - 1.5 x QOR, 3Q + 1.5 x IQR < 이상치
(min) (max)
“데이터 직무에 대한 특강과 부트캠프 커리큘럼에 대한 소개
한 주 수업을 마무리하면서 데이터 분석가로서 중요한 항목은 다양한 프로젝트를 경험해 보는 것이었다.
SQL은 코딩 테스트나 문제집을 풀면서 공부를 하고 도메인 지식을 넓히기 위해서는 가고 싶은 기업에 대한 뉴스나 기사 등을 꾸준히 봐야 된다.
다양한 공모전을 참여하여 데이터 분석가로서 쌓는 경험들을 포트폴리오나 자소서에 작성하여 중요한 자산이 되게 만들어야겠다.
”