Datasets
O repositorio cobre dois grupos de datasets: sinteticos e reais pequenos empacotados.
Sinteticos
xorbinariomulticlasseregressao
Esses datasets sao bons para estudar o comportamento do algoritmo de forma controlada.
Reais empacotados
iris: classificacao multiclasse com 150 amostraswine: classificacao multiclasse com 178 amostrasdiabetes: regressao com 442 amostras
Eles ficam dentro do pacote em src/datasets/ e podem ser usados mesmo depois de instalar o projeto via pip.
Exemplo de uso
from rede_neural_do_zero import DataUtils
X, y, meta = DataUtils.carregar_dataset_wine(normalizar="padrao")
print(X.shape, y.shape)
print(meta["feature_names"])
print(meta["tipo_tarefa"])
Quando usar cada um
xor: entender nao linearidadebinario: estudar classificacao binaria com fronteira 2Dmulticlasse: estudarsoftmaxe matriz de confusaoregressao: estudar saida linear emseirisewine: mostrar que o projeto funciona em datasets reais pequenosdiabetes: demonstrar regressao em um dataset real
Onde cada coisa fica
src/datasets/: CSVs reais distribuidos junto do pacotesrc/data/: geracao de datasets sinteticos e utilitariosdata/: notas de apoio do repositorio sobre dados e exemplos