728x90

분류 전체보기 112

[ML] Model evaluation metrics

Accuracy(정확도) - 예측을 정확하게 한 정도 Error Rate(오류도) - 예측을 실패한 정도 Sensitivity (민감도)(Recall for negative class) == Recall(재현율) - 실제 P중에 예측으로 맞춘 정도 Specificity (특이도)(Recall for positive class) - 실제 N중에 예측으로 맞춘 정도 pecision(정밀도) - P로 예측한것 중에 맞준정도 fall-out(위양성율) - P로 예측한것 중에 틀린정도 F1 score - 보통 불균형한 데이터 분포에서의 분류문제에 평가척도로 사용. -F1은 정밀도와 재현도를 이용해 조화평균을 구하여 평가 척도를 구성했기 때문에, 불균형 데이터일지라도 값의 크기 차이가 어느정도 상쇄되므로 데이터 분..

[Python] conditional expression, list comprehension

conditional expression if score >= 60: message = "success" else: message = "failure" ▼ message = "success" if score >= 60 else "failur 더보기 #숫자를 비교해서 같으면 1 다르면 -1 def solution(num1, num2): return 1 if num1==num2 else -1 list comprehension a = [1,2,3,4] result = [] for num in a: result.append(num*3) print(result) #출력[3, 6, 9, 12] ▼ a = [1,2,3,4] result = [num * 3 for num in a] print(result) #출력 [3..

[Python] 연산관련 function과 method

Operational related functions sum() a + b numbers = [1, 2, 3, 4, 5] total = sum(numbers) print(total) # 출력: 15 divmod() a/b result = divmod(13, 5) print(result) # 출력: (2, 3) pow() a**b result = pow(2, 3) print(result) # 출력: 8 abs() 절대값 number = -5 absolute_value = abs(number) print(absolute_value) # 출력: 5 round() 반올림 number = 3.7 rounded_number = round(number) print(rounded_number) # 출력: 4 max()..

[Python] lambda

lambda는 수학에서 사용되는 람다 대수(lambda calculus)에서 유래한 용어이다. 람다 대수는 알론조 처치(Alonzo Church)가 1930년대에 개발한 형식적인 계산 모델로, 함수 정의와 함수 적용을 간단한 표기법으로 표현하는 수학적인 기법이다. 파이썬에서의 lambda 키워드는 람다 대수의 표기법을 차용하여 익명 함수를 생성하는 데 사용되고 있다. lambda는 함수를 생성할 때 사용하는 예약어로, def와 동일한 역할을 하며, 보통 함수를 한줄로 간결하게 만들때 사용한다. lambda에 대한 사용법은 아래와 같다. #두 수의 차 solution = lambda a, b : a-b lamda는 다른 함수의 인자로 전달되거나 간단한 로직을 처리할 용도로 쓰일 수 있다. # 두 수를 더하..

[Python] Class - Type Hint,상속, Duck typing, super(), __init__,self, classmethod, staticmethod

Type Hint class를 만들때나 이외의 상황에서 type hint를 지정할 수 있다. Type hint를 지키지 않는다고 Error가 생기거나 하는 기능적인 것은 없으며, 가독성에 유리 하기 때문에 사용을 권장한다. class Courier(object): def assign(self, name: str, address: str) -> str : 위 코드에서 변수에 :str, :int 형태로 넣을 수 있고, ->str , ->None 형태로 결과 값에 대한 hint도 제공할 수 있다. 상속 (Inheritance) 기존 클래스를 활용하여 내용을 추가, 수정하기 위해서 사용한다. 기존의 class를 수정하거나 거기에 내용을 추가해도 되지만 기존 class의 형태를 유지하여야 하거나 수정이 허용되지 ..

[Job] Employment requirement about DS

Toss (금융) 2023/07 데이터 및 머신러닝에 대한 수학적 이해와 통계적 지식 머신러닝 등 최신 알고리즘을 활용한 실제 비즈니스 문제 해결 경험이 필요해요. SQL, Python, R TensorFlow, PyTorch 문제해결을 위해 데이터에 기반한 의사결정 개선된 방향을 제시하는 경험이 풍부 금융 서비스의 데이터 분석과 모델링의 경험 Hadoop이나, Spark, Hive 같은 빅데이터 분석 플랫폼 사용 경험과 대용량 데이터 분산 처리에 대한 이해가 그동안 해오신 업무 중 임팩트 있었던 프로젝트를 구체적으로 기입 특히 데이터로 해결해야 하는 문제를 인지하고 해결하며 비즈니스에 미치는 영향을 f/u하고 고도화해 나간 경험의 A to Z를 구체적으로 작성 경험하신 모델링 프로젝트에 대해 어떤 머신..

Misc 2023.07.17

[ML] A comparison between Scalers

Standard Scaler 정규 분포 형태를 따른다. 각 열의 feature 값의 평균을 0으로 잡고, 표준 편차를 1로 간주하여정규화 하는 방법 각 데이터가 평균에서 얼마간의 표준편차 만큼 떨어져 있는지를 기준으로 삼는다. 데이터의 최대치와 최고치를 모를때 사용되며 이상치에 영향을 받는다. 데이터 특징을 모르는 경우 선택 할 수 있는 가장 무난한 종류의 정규화중 하나이다. Normalizer 각 변 수의 값이 원점으로부터 1만큼 떨어진 범위로 변환한다. (=벡터의 유클리드 길이가 1이 되도록 조정한다) 빠르게 학습할 수 있고 과대적합 확률을 낮출 수 있다. 벨터의 길이가 아니라 데이터의 방향이 중요한 경우 자주 사용한다. MinMax Scaler 각 feature의 최소값과 최대값을 기준으로 0 ~ ..

728x90
반응형