DATA SCIENCE UNIVERSITY
Um repositório gratuito e curado para impulsionar sua carreira em Ciência de Dados, Aprendizado de Máquina e Redes Neurais
Missão do projeto
Impulsionar e acelarar o aprendizado de forma gratuita em Ciência de Dados, Aprendizado de Máquina e Redes Neurais
Large Language Models
Large Language Models são poderosos modelos de inteligência artificial que podem processar e gerar texto semelhante ao humano, analisando vastas quantidades de dados linguísticos. Eles têm o potencial de revolucionar a compreensão da linguagem natural e diversas aplicações, como chatbots, tradução de idiomas e geração de conteúdo.
Teoria das Restrições
A Teoria das Restrições é uma metodologia de gestão que busca identificar e eliminar obstáculos que limitam o desempenho de um sistema, visando melhorar sua eficiência e produtividade de forma estratégica. Com foco na maximização dos resultados, essa abordagem é amplamente aplicada em diversas áreas empresariais.
Anotações WEB
Coletânea de Links para Hospedagem de Sites e Serviços
Automatizações dos processos de extração e Carga
Python Visão Geral
Mapa do Python by DidáticaTech. Vídeo com as principais bibliotecas para estudar python. Análise de Dados, Web, Games, RPA, Dev Web e Dev Android.
Linguagem Python - Básico
Variáveis
Estruras básicas - Strings, Lista, Tuplas, Conjuntos e Dicionários
Estruturas de controle - Decisão e Repetição
Funções e Funções Lambda
Operações com Arquivos
List Compreension
Tratamento de Erros
Iterators e Generators
Linguagem Python - Intermediário
Trabalhando com strings
Formatação
Codificação
Métodos
Expressões Regulares
biblioteca re
comandos findall, sub, split
comandos search, match
Metacaracteres padrões \d,\D,\w,\W,\s,\S
Quantificadores ?, *, +, {n}, {a,b}, {,b},{a,}
Metacaracteres ., ^, $, |, [], [^], intervalos
Orientação a Objetos
Trabalhando com Datas
Pacote Collections, Map e Filter
Sistema Operacional
Python para Excel
Pacote Pandas
Pacote Numpy
Linguagem Python - Avançado
Decorators
Criação de Pacotes em Python
Programação Paralela em Python
Web Scraping/Crawler
Bancos de Dados com Python
Python com Azure
Aprendizado de Máquina
Aprendizado de Máquina: Uma abordagem Estatística. Livro e Playlist de Explicação. Conhecimento abrangente. Precisa de conceitos para acompanhar.
Aprendizado de Máquina 01. Prof. Diego Silva. UFSCAR.
Aprendizado de Máquina 02. Prof. Diego Silva. UFSCAR.
Intro to Machine Learning, Georgia Tech. 494 vídeos.
Machine Learning, Georgia Tech. Excelente Didática. 336 vídeos. SVM, Boosting, PCA, Bayes, ... Em curadoria.
Aprendizado Supervisionado Parte 01, Georgia Tech. 112 vídeos.
Reinforced Learning, Parte 03, Georgia Tech. 121 vídeos
Reinforced Learning, Georgia Tech. 204 vídeos.
Machine Learning for Trading, Gerogia Tech. 218 Vídeos.
Machine Learning, Andrew Ng, Stanford. 112 Vídeos.
IA all in One, Playlist com excelentes apresentações.
Definição
Tipos de Aprendizado
Supervisionado
Não Supervisionado
Semi-Supervisionado
Por Reforço
Auto-Aprendizado
Aprendizado Supervisionado
Tipo Regressivo
Técnicas
Métricas
Tipo Classificador
Técnicas
Métricas
Aprendizado Não Supervisionado
Aprendizado Não Supervisionado
Clustering
https://realpython.com/k-means-clustering-python/
https://towardsdatascience.com/machine-learning-algorithms-part-12-hierarchical-agglomerative-clustering-example-in-python-1e18e0075019
Algoritmos Hierárquicos
https://www.section.io/engineering-education/hierarchical-clustering-in-python/
https://machinelearningknowledge.ai/agglomerative-hierarchical-clustering-in-python-sklearn-scipy/
https://www.section.io/engineering-education/hierarchical-clustering-in-python/
https://stackabuse.com/hierarchical-clustering-with-python-and-scikit-learn/
http://www.slimsuite.unsw.edu.au/teaching/upgma/
Algoritmos Particionais
Mistura de Gaussianas
https://www.kaggle.com/code/charel/learn-by-example-expectation-maximization/notebook
https://python-course.eu/machine-learning/expectation-maximization-and-gaussian-mixture-models-gmm.php
https://medium.com/@prateek.shubham.94/expectation-maximization-algorithm-7a4d1b65ca55
https://jakevdp.github.io/PythonDataScienceHandbook/05.12-gaussian-mixtures.html
https://towardsdatascience.com/gaussian-mixture-models-d13a5e915c8e
https://towardsdatascience.com/fuzzy-c-means-clustering-with-python-f4908c714081
Algoritmos baseados em densidade
https://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html?highlight=dbscan#sklearn.cluster.DBSCAN
Técnicas de Validação
Recursos Destaque
https://pyclustering.github.io/docs/0.10.1/html/de/df0/namespacepyclustering_1_1cluster_1_1fcm.html
https://docs.scipy.org/doc/scipy/reference/cluster.hierarchy.html#module-scipy.cluster.hierarchy
https://scikit-learn.org/stable/modules/classes.html#module-sklearn.cluster
https://github.com/PacktPublishing/Hands-On-Data-Science-and-Python-Machine-Learning/blob/master/KMeans.ipynb
Redes Neurais Aritificiais
Deep Learning, Udacity. Playlist 64 vídeos.
Introdução
Perceptron
Aprendizado
Tipos de Redes Neurais
Tipos de Camadas
Pool
...
Encoders/Decoders
Transformers
Adversariais
Recorrentes LSTM
MultiCamadas
Ferramentas
Ataques
Explanable AI - XAI
Transferência de Conhecimento
Processamento Natural de Linguagem
Etapas
Normalização
Vetorização
Tarefas
Técnicas de Vetorização
...
Projeções, LSA, NMF, LDA, UFBA
Tarefas
Tradução
NER
POS
Classificação
Taxonomia
Resumo
CHAT/Query
Pacotes Python
NLTK
Spacy
GenSim
Cursos Online
Referências
Jurafsky, D. and Martin, J.H. (2008). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Prentice Hall. Parcialmente disponível em https://web.stanford.edu/~jurafsky/slp3/
The Oxford Handbook of Computational Linguistics. Oxford University Press. - Ferreira, M. e Lopes, M. (2019). Para Conhecer Linguística Computacional. 1a edição. Editora Contexto.
Fundamentos - Cálculo
Conceito de Derivadas
Técnicas de Derivação básicas
polinômio, sen, cos, exponencial, logaritmo, potência
Aplicação de Derivada em Otimização
Gradiente
Fundamentos - Estatística
Estatística Descritiva
Medidas de Tendência Central
Medidas de Posição
Medidas de Variabilidade
Estatística Diagnóstica
Regressão Linear
Regressão Logística
Fundamentos - Probabilidade
Probabilidade
Fundamento
Teorema de Bayes
Distribuições
Teste de Hipótese
Avançado - Análise Multivariada
Análise Multivariada
Componentes Principais
Análise Discriminante
Pesquisa Operacional - Programação Linear
Pesquisa Operacional - Programação Não Linear
Pesquisa Operacional - Simulação
Engenharia de Dados I - Modelo Relacional
Engenharia de Dados II - Modelo Dimensional
Engenharia de Dados III - Modelos NoSQL
Sistema Operacional Linux
Comandos do SO
SSH
Virtualização
Docker
Kubernetes
Azure
Fundamentals
Data Science
ML
Armazenamento
Blobs
Filas
Tabelas
Bancos de Dados
Máquinas Virtuais
Power Shell
Power Automate
Data Factory
Data Bricks
Azure Synapse
Visualização e Entrega
Storytelling
Power BI
Visualização com Python
Matplotlib
Plotly
Bokeh
Programação para Internet
HTML
XPath
/, //, *
@
filtros [], contains
Json
XML
CSS
JavaScript
Frameworks
Django
Flask
FrontEnd
Bootstrap
Angular
React
Node.js
Vue
Inovação
BlockChain
IOT
Robot Proccess Automation com Python - RPA
Ferramentas
DBEAVER
Negócio
Cadeia de Suprimentos
Conceitos
Troca Eletrônica de Documentos
Fiscal
Planejamento
Sell IN/Sell Out
Indicadores
Giro de Estoque
Ruptura
OSA
TVD
IVD
Varejo
Sortimento
Categorias
GS1 - GTIN/Global Identificator
Economia
Macroeconomia
Indicadores Econômicos
Elasticidade de Preço
Consumidor
Comportamento do Consumidor
Churn
Teoria das Restrições
Contabilidade
Análise de Balanço
Índices Contábeis
ROI
Matemática Financeira
Juros Simples/Composto
Análise de Investimentos
Payback, TIR, VPL
Metodologia Multicritério
Benchmark/Data Envelopment Analysis (DEA)
Teoria da Utilidade
AHP
Promethee
Aditivo