Resumo dos Artefatos
Aqui pessoal vou colocar um resumo dos artefatos.
Eles serão atualizados no ADALOVE ainda, peço um pouco de paciencia para essa modificação.
Os nossos artefatos serão entregues seguindo os padrões do desenvolvimento ágil, com entregas de valor a cada sprint. Para cada uma das etapas do projeto, teremos artefatos específicos que serão entregues, com valor incremental em cada uma delas.
Pessoal um ponto muito importante que deve estar sempre claro para vocës é que a entrega de valor é o que importa. Não adianta entregar um monte de artefatos se eles não agregam valor ao projeto. Estou colocando aqui quais são os artefatos esperados para cada sprint, mas vocês devem, como equipe de desenvolvimento, verificar qual valor será entregue em cada sprint.
Sprint 1
Proposta de Modelo de Predição em Versão Notebook (conhecimento prévio).
Está sprint tem por objetivo entregar um modelo de predição em versão notebook. O modelo deve ser construído com base nos dados fornecidos e deve ser validado com o cliente. A documentação do modelo deve ser entregue, com a descrição do problema, a descrição dos dados, a descrição do modelo e a descrição dos resultados.
A metodoologia de CRISP-DM deve ser seguida, com a construção do modelo de predição, a avaliação do modelo e a implementação do modelo.
Os dados do modelo, taxa de acerto, taxa de erro, matriz de confusão e curva ROC devem ser apresentados.
Artefato - Entendimento do Negócio
Eles serão atualizados no ADALOVE ainda, peço um pouco de paciencia para essa modificação.
Elaborar uma apresentação para o parceiro contendo a análise do cenário. Os itens da entrega serão:
- Matriz de Risco - deve ser feita considerando o projeto que os grupos estão criando, protótipo e produto final. Deve ser entregue no template disponível no drive da turma. (peso 3,5)
A matriz de risco é uma ferramenta utilizada no gerenciamento de riscos para avaliar e priorizar riscos com base em sua probabilidade de ocorrência e impacto potencial. Essa ferramenta visual ajuda as organizações a identificar quais riscos requerem atenção imediata e quais podem ser monitorados com menos urgência. Tipicamente, a matriz é organizada em um formato de grade com a probabilidade de um lado e o impacto no outro, criando quadrantes que categorizam os riscos como baixos, moderados, altos ou extremos. Isso permite que gerentes e equipes de projeto tomem decisões informadas sobre onde concentrar recursos e esforços para mitigação de riscos, contribuindo para uma gestão mais eficaz e proativa dos desafios potenciais.
- Canvas Proposta de Valor - deve ser feito considerando a solução que vocês estão desenvolvendo. (Usar o template disponível no drive da turma) (peso 3,5)
O Business Model Canvas é uma ferramenta estratégica de gestão e planejamento que permite visualizar as principais funções de um negócio em um único quadro. Criado por Alexander Osterwalder, este modelo é dividido em nove blocos principais que cobrem os elementos cruciais de um negócio: Segmentos de Clientes, Propostas de Valor, Canais, Relacionamento com Clientes, Fontes de Receita, Recursos Principais, Atividades-chave, Parcerias Principais e Estrutura de Custos. A utilização do Canvas facilita a compreensão, design e inovação de modelos de negócios, ajudando empreendedores e empresas a alinhar suas atividades por meio de uma visão clara e compartilhada, garantindo que todas as partes do negócio trabalhem em harmonia para alcançar seus objetivos estratégicos.
Template do business model canvas
- Análise financeira do projeto - deve ser realizado um levantamento de custos do protótipo e do projeto implementado. Devem ser destacas fontes de receita e estrutura de custos. Detalhando, claramente à sua ligação com a proposta de valor e fundamentais para a viabilidade financeira do negócio. (peso 3,0)
O envio deve ser disponibilizado na documentação do grupo, na seção dedicada ao artefato.
Artefato - Economia Circular e Mapeamento do Ciclo de Produção e Consumo
Realizar mapeamento (incluindo levantamento e representação visual interativa) de matérias-primas, recursos, processos e impactos (sociais e ambientais) implicados na fabricação, logística, utilização, reutilização, reciclagem e descarte (incluindo possibilidades adequadas e inadequadas) dos componentes na atividade produtiva do parceiro de negócio. Os itens da entrega serão:
-
Levantamento de requisitos de visualização para o projeto (quais as necessidades, opções e possibilidades de acesso e visualização de dados para o projeto?).
-
A partir do briefing e material fornecido pelo parceiro, realizar o levantamento de matérias-primas, recursos, processos e impactos (sociais e ambientais) envolvidos na atividade fim do parceiro.
-
Partindo da compreensão da relação entre os elementos no processo produtivo, elaborar um infográfico interativo que inclua, em sua representação:
- Ciclo principal atual de produção e suas variações e subdivisões;
- Indicativos e justificativas para os principais pontos de fragilidade e risco (em que contextos do ciclo produtivo há mais chances de acontecerem problemas na cadeia? Por quê?);
- Se aplicável, tipos de usuário e permissões de acesso à informação (quem deve acessar determinados dados e em qual contexto?).
O grupo apresentará e justificará um infográfico interativo que deve descrever com clareza o ciclo produtivo e seus pontos de risco e fragilidade, apontando também impactos sociais e ambientais do ciclo produtivo. As fontes de dados representados devem ser referenciadas.
-
Entendimento do problema; qualidade e detalhamento dos dados levantados sobre o ciclo de produção e consumo. (peso 3)
-
Apresentação, de forma didática, dos dados levantados de modo a oferecer um panorama geral do ciclo produtivo, contextualizando-o ao tema de ESG e economia circular. (peso 4)
-
Fundamentação dos dados em referências. (peso 3)
Artefato - Requisitos de viabilidade técnica
Realizar a análise de requisitos e elaborar um documento preliminar de viabilidade técnica. Apresentar a visão geral do sistema e seus principais componentes. Os itens da entrega serão: análise de requisitos, viabilidade técnica e proposta geral do sistema. A documentação deve ser atualizada no arquivo markdown disponível no repositório da equipe no GitHub, sempre na branch principal e com uma tag referente à entrega do sprint.
- Apresentar quais são os requisitos funcionais do sistema. (peso 2)
- Apresentar quais são os requisitos não funcionais do sistema. (peso 2)
- Apresentar o estudo da viabilidade técnica realizada. (peso 2)
- Definição clara do objeto da proposta geral do sistema. (peso 2)
- Descrição objetiva dos elementos gerais que vão compor a solução inicial proposta (diagrama de blocos). (peso 2)
Artefato - Primeiro modelo de predição
Construir e documentar um modelo de predição utilizando as ferramentas apresentadas até o momento. Ele deve ser construído utilizando um notebook Python. As métricas de avaliação do modelo devem ser apresentadas em sua documentação.
O modelo deve ser construído utilizando os dados fornecidos pelo parceiro. Todo o processo deve ser documentado seguindo a metodologia CRISP-DM. Verificar mais detalhes no material de apoio do projeto: link.
A modelagem deve ser construída utilizando a metodologia CRISP-DM. Das etapas propostas na metodologia, está implementação vai da etapa 1 até a etapa 5. Elas devem estar bem caracterízadas na documentação do modelo.
A construção de cada uma das etapas, deve trazer consigo uma explicação clara para as escolhas realizadas e as métricas de avaliação que sustentam a escolha do modelo. Incluir essas informações na documentação do modelo. A documentação do modelo não deve estar apenas nos notebooks desenvolvidos. Ela deve ser acessível na documentação do projeto.
Cuidado para não deixar informações sensíveis publicamente expostas. Notebooks não devem estar públicos e a documentação do projeto não deve conter informações do parceiro que possam caracterizar ele.
Barema de avaliação:
| Grupo de Avaliação | Descrição | Intervalo de Nota |
|---|---|---|
| Não Iniciou | Não entregou o artefato ou apenas entregou um notebook sem conteúdo relacionado. | 0.0 - 1.0 |
| Iniciou | Iniciou a construção do modelo, mas não justificou nenhuma das escolhas e não apresentou nenhuma métrica de avaliação do modelo. | 1.1 - 3.0 |
| Em Andamento | Iniciou a construção do modelo, mas não justificou as escolhas realizadas e não apresentou as métricas de avaliação do modelo. | 3.1 - 5.0 |
| Atende | Construiu o modelo, justificou todas as escolhas e apresentou todas as métricas de avaliação do modelo. | 5.1 - 9.0 |
| Supera | Construiu o modelo, justificou todas as escolhas e apresentou todas as métricas de avaliação do modelo. Além disso, apresentou um modelo com bom desempenho dentro das métricas apresentadas. | 9.1 - 10.0 |
Sprint 2
Deploy do Modelo com uma API de Interface, Modelo implementado com rede neural recorrente
Está sprint tem por objetivo aprimorar os modelos apresentados até aqui. As comparações quanto a evolução do modelo devem ser apresentadas. A documentação do modelo deve ser atualizada, com a descrição do problema, a descrição dos dados, a descrição do modelo e a descrição dos resultados.
Além disso, a implementação de uma API de interface deve ser realizada, com a integração do modelo de predição. O modelo deve ser implementado com uma rede neural recorrente. A API deve ser implementada utilizando o framework FastAPI. O modelo deve ser capaz de receber uma requisição com os dados necessários para fazer a predição e retornar a predição.
O modelo deve ser treinado utilizando os dados fornecidos pelo parceiro. O modelo deve ser avaliado utilizando as métricas de avaliação definidas na documentação do modelo. Deve ser apresentado a documentação da API e a documentação do modelo. Verificar mais detalhes no material de apoio do projeto: link.
Barema de avaliação:
| Grupo de Avaliação | Descrição | Intervalo de Nota |
|---|---|---|
| Não Iniciou | Não entregou a implementação do modelo e nenhuma API de acesso. | 0.0 - 1.0 |
| Iniciou | Implementou parcialmente o modelo sem utilizar rede recorrente e a API de acesso. | 1.1 - 3.0 |
| Em Andamento | Possui um modelo sem utilizar rede recorrente e uma API implementados parcialmente. A API não atende todas as requisições corretamente e o desempenho do modelo não apresenta um desempenho satisfatório. | 3.1 - 5.0 |
| Atende | Construiu o modelo utilizando rede recorrente, justificou todas as escolhas e apresentou todas as métricas de avaliação do modelo. Implementou uma API para sua utilização que responde corretamente as requisições enviadas para ela. | 5.1 - 9.0 |
| Supera | Construiu o modelo utilizando rede recorrente, justificou todas as escolhas e apresentou todas as métricas de avaliação do modelo. Além disso, apresentou um modelo com bom desempenho dentro das métricas apresentadas. | 9.1 - 10.0 |
Sprint 3
Dockerização da Aplicação e construção de Datalake
Nessa sprint, a aplicação deve ser dockerizada, com a construção de um datalake para armazenamento dos dados. A documentação do sistema deve ser atualizada, com a descrição do problema, a descrição dos dados, a descrição do modelo e a descrição dos resultados.
A aplicação ainda estará em execução local, com a integração do modelo de predição.
| Grupo de Avaliação | Descrição | Intervalo de Nota |
|---|---|---|
| Não Iniciou | Não implementou a solução dockerizada e não entregou o Datalake. | 0.0 - 1.0 |
| Iniciou | Implementou parcialmente o Datalake, mas não dockerizou a solução. | 1.1 - 3.0 |
| Em Andamento | Iniciou o processo de dockerização e implementação do Datalake. O Datalake ainda não está totalmente implementado e os elementos dockerizados ainda não estão complementamente integrados. | 3.1 - 5.0 |
| Atende | A solução está dockerizada e o Datalake foi implementado corretamente. | 5.1 - 9.0 |
| Supera | Além da implementação dockerizada e do Datalake, implementou um sistema de monitoramento da saúde das instâncias, permitindo verificar se ele está em funcionamento. | 9.1 - 10.0 |
Sprint 4
Implementação do ETL, Datawarehouse, Pipeline de treinamento, Dashboard de visualização
A Implementação de IA consiste nos seguintes itens:
- Projeto do Fluxo de Retreinamento do modelo;
- Construção do processo de ETL;
- Pipeline de Treinamento do Modelo; e
- Visualização de dados.
O desenvolvimento do projeto compreende os aspectos técnicos da implementação. Ele deve ocorrer de forma estruturada e organizada com relação aos objetivos, metas e tarefas. A sua apresentação deve ser feita durante o review, sintetizando os principais desafios e resultados obtidos. Todo o processo deve estar dockerizado.
Vamos verificar cada uma destas etapas:
-
Projeto do Fluxo de Retreinamento do modelo: esta etapa consiste na definição de como os dados serão utilizados para realizar o processo de retreinamento do modelo. É importante deixar claro aqui qual o modelo será utilizado na realização do retreinamento do modelo. Ele estará disponível para todos os usuários? Qual a regra para realizar o retreinamento? Como os modelos são armazenados e ainda como escolher entre estes modelos. Importante destacar que, neste artefato, o que será entregue é um modelo conceitual sobre o fluxo, não sua instanciação. (Até 1.0 ponto)
-
Construção do processo de ETL: esta etapa consiste no processo de recuperar/extrair os dados para realizar o treinamento. A recuperação dos dados consiste em buscar os dados do parceiro para realizar o treinamento/retreinamento do modelo. É importante que ela esteja alinhada com o que foi definido no fluxo do modelo. Isso quer dizer como vocês vão receber os dados, processá-los para que eles possam ser utilizados no processo de treinamento do modelo. Está etapa PRECISA SER IMPLEMENTADA e DEVE ESTAR INTEGRADA COM O RESTANTE DO SISTEMA DE VOCÊS. (Até 2.5 pontos)
-
Pipeline de Treinamento do Modelo: esta etapa consiste na implementação do processo de retreinamento do modelo. Ele pode ser realizado com todos os dados, ou de forma incremental com novos dados, de acordo com o que foi previsto no projeto do fluxo do modelo. Também faz parte desta etapa, a definição de como os modelos deverão ficar armazenados e como eles poderão substituir o modelo atual. Cabe destacar que é RECOMENDAVEL manter alguma rastreabilidade sobre qual a precisão dos modelos, quando ele foi treinado, qual o conjunto de dados utilizado e por qual período ele ficou ativo no sistema. (Até 4.0 pontos)
-
Visualização de dados: esta etapa consiste na construção das visualizações dos dados que serão fornecidos pelo sistema. Este ponto está levando em consideração a visualização simplificada (direta) e a visualização com mais detalhes do sistema (para os usuários da manutenção/qualidade). Serão avaliados aqui características como: usabilidade do sistema, qualidade das visualizações e características de implementação. Quanto a características de implementação, serão avaliados as práticas de código (arquitetura da solução, funcionalidades) utilizadas para realizar a implementação da solução. As tecnologias utilizadas aqui são a critério do grupo, cabe destacar que devem estar claro qual a motivação das escolhas para estas tecnologias. (Até 2.5 pontos)
A documentação deve trazer uma visão holística da implementação, trazendo um aprofundamento de todos os seus detalhes técnicos. O código fonte deve atender às boas práticas de programação, arquitetura de software e usar um estilo condizente com as diretrizes da(s) linguagem(ns) utilizadas.
Verificar mais detalhes no material de apoio do projeto: https://murilo-zc.github.io/M7-Inteli-Eng-Comp/Artefatos/ Os repositórios, que devem estar atualizados com a última versão da documentação, também serão avaliados. Serão considerados os seguintes critérios:
-
O repositório deve conter um diretório 'src' para o código fonte. Pode haver variações no nome, mas todo o código fonte da solução deve estar em único repositório.
-
O README do repositório deve conter instruções de como iniciar a documentação.
-
A documentação deve estar funcional.
-
A documentação do projeto deve deixar claro como executar o sistema.
-
Os códigos do modelo devem estar disponíveis no repositório.
-
O repositório não deve conter dados sensíveis dos clientes.
Sprint 5
Cloud
Nesta sprint, a aplicação será migrada para a nuvem, com a implementação de um pipeline de treinamento e de um dashboard de visualização. A documentação do sistema deve ser atualizada, com a descrição do problema, a descrição dos dados, a descrição do modelo e a descrição dos resultados.