Ciência de Dados
Licenciatura
Acreditações

Período de aulas
Propinas estudantes UE (2023/2024)
Propinas estudantes fora da UE (2023/2024)
A Licenciatura em Ciência de Dados (LCD) está alicerçada na convergência das várias áreas científicas - Matemática, Estatística e Informática – com um plano construído em torno da atividade de projeto, onde se promove uma reflexão prática e teórica, no sentido de dotar o aluno para um pensamento informado, crítico e autónomo perante as várias dimensões dos dados na Sociedade do Conhecimento e em plena Revolução Digital.
A Licenciatura está bem sedimentada na apreensão, compreensão e experimentação nas áreas base de conhecimento, seguida por uma aquisição de progressiva autonomia do estudante e na capacidade de responder a problemas de complexidade crescente.
Com a síntese operada nos dois últimos semestres, consolida-se a coerência de um programa formativo de acordo com uma prática consolidada e a exigência de requisitos profissionais excecionais, de modo a responder aos desafios da sociedade moderna.
Plano de Estudos para 2023/2024
Unidades curriculares | Créditos | |
---|---|---|
1º Ano | ||
Dados na Ciência, Gestão e Sociedade
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Fundamentos de Álgebra Linear
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Programação
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Tópicos de Matemática I
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Amostragem e Fontes de Informação
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Análise Exploratória de Dados
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Estruturas de Dados e Algoritmos
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Optimização para Ciência de Dados
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Tópicos de Matemática II
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Escrita de Textos Técnicos e Científicos
2.0 ECTS
|
Optativas > Competências Transversais > Obrigatórias | 2.0 |
Pensamento Crítico
2.0 ECTS
|
Optativas > Competências Transversais > Obrigatórias | 2.0 |
Optativas > Competências Transversais > Facultativas
|
||
Optativas > Competências Transversais > Facultativas
|
||
Optativas > Competências Transversais > Facultativas
|
||
2º Ano | ||
Armazenamento para Big Data
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Estatística Computacional
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Fundamentos em Gestão de Bases de Dados
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Introdução A Modelos Dinâmicos
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Segurança, Ética e Privacidade
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Métodos de Aprendizagem Não Supervisionada
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Métodos de Aprendizagem Supervisionada
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Optimização Heurística
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Processamento de Big Data
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Projeto Aplicado em Ciência de Dados I
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
3º Ano | ||
Análise de Redes
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Inteligência Artificial Simbólica para Ciência de Dados
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Interfaces Web para A Gestão de Dados
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Modelação Estocástica
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Projeto Aplicado em Ciência de Dados II
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Análise da Performance em Gestão
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Projeto Final Aplicado em Ciência dos Dados
12.0 ECTS
|
Unidades Curriculares Obrigatórias | 12.0 |
Optativas > Livres
|
||
Optativas > Livres
|
Dados na Ciência, Gestão e Sociedade
O objetivo principal desta unidade curricular é o de relacionar os conteúdos técnicos previstos no plano curricular numa perspetiva crítica reflexiva sobre os dados e as estratégias de Ciência de Dados. Os estudantes apreenderão as diferentes visões de diferentes sectores (Ciência, Gestão e Sociedade em geral) relativamente à Ciência de Dados.
Os estudantes são introduzidos a esta área de investigação e aplicação em crescimento, ao seu espírito e aos seus princípios básicos e às principais ferramentas, bem como alertados para as implicações éticas do uso e modelação de dados.
Conteúdos Programáticos (CP):
CP1. O que são dados e como pensar com dados.
CP2. Tipos de Problemas tratados em Ciência de Dados e especificidades nos domínios da Ciência, Gestão e Sociedade.
CP3. Diferentes tradições e metodologias de investigação e definições de aquisição de conhecimento.
CP4. Tradução de desafios reais para conceitos técnicos e de acordo com uma linguagem cientificamente orientada.
CP5. Exposição de casos práticos.
CP6. A dimensão ética das e nas estratégias de utilização de dados.
Avaliação periódica: - Exercícios (extra aula): 40% (ver campo de Observações) - Um teste intercalar: 30% - Projeto (trabalho de grupo com avaliação por pares): 30%Exame: Exame escrito00%
Bibliografia- Shutt, R., O?Neill, C. (2014) Doing Data Science Straight Talk from the Frontline. O?Reilly - Borgman, C. L. (2015). Big data, little data, no data: scholarship in the networked world. MIT press. - Kitchin, R. (2014). The data revolution: Big data, open data, data infrastructures and their consequences. Sage
Bibliografia Opcional- Davenport, T., Harris, J., and Morison, R. (2010) Analytics at work: smarter decisions, better results. Harvard Business Review Press, USA.- Turban, E., Sharda, R., Delen, D. (2010) Decision Support and Business Intelligence Systems (9th Eds). Pearson Education, Inc, USA- Davenport, T. (2014) Big Data at Work: Dispelling the Myths, Uncovering the Opportunities. Harvard Business Review, USA.
Fundamentos de Álgebra Linear
Na formulação de problemas em todas as ciências, as matrizes são uma ferramenta elementar e essencial. Este curso pretende dar uma formação básica em álgebra linear, com especial ênfase na linguagem de teoria de matrizes, e ilustrar a sua importância no "mundo real".
Programa1 Vetores em R^n
O espaço vetorial R^n, Dependência linear, Sistemas de equações lineares, Subespaços vetoriais, Bases, dimensão e coordenadas, Produto interno, norma e ângulo, Ortogonalidade
2 Matrizes
Classes de matrizes, A estrutura de espaço vetorial de M_{mxn}, Produto de matrizes, Transposição, Matriz inversa
3 Determinantes
O determinante de uma matriz, Definição, propriedades e interpretação geométrica, Determinantes e operações elementares, Matriz adjunta e sistemas de Cramer, Matriz adjunta e fórmula da inversa, Sistemas de Cramer
4 Funções lineares
O espaço L(U,V), O conceito abstrato de espaço vetorial, Funções lineares, O kernel, A imagem, O teorema da dimensão, O isomorfismo L(U,V) = M_{mxn}, A matriz de uma função linear, Álgebra das matrizes vs Álgebra das funções lineares, Mudança de base
5 Valores e vetores próprios
Valores e vetores próprios dum endomorfismo, Diagonalização de endomorfismos
A aprovação na UC (9.5 valores ou mais) poderá ser obtida através de qualquer uma das seguintes duas modalidades:A. Avaliação Periódica:? 3 mini-testes em aula (20%), contando para a nota final as duas melhores notas obtidas; nota mínima de 10.0 valores na média aritmética dos dois melhores mini-testes.? 2 quizzes online (10%), na plataforma de e-learning Moodle; nota mínima de 10.0 valores na média aritmética dos quizzes.? Frequência (70%): prova escrita realizada na 1a época ou na 2a época de avaliação; nota mínima de 8.0 valores.? Assiduidade mínima de 16 aulas (correspondendo a 2/3 do total de aulas).As médias aritméticas serão arredondadas à décima mais próxima.A nota final será arredondada à unidade mais próxima.B. Avaliação por Exame:? Realização de uma prova escrita (ou seja, exame contando 100%), em qualquer uma das épocas de exame. Se a nota obtida por exame for melhor que a média ponderada da modalidade A a avaliação passa automaticamente para a modalidade B.Sobre os mini-testes em aula:? Serão realizados 3 mini-testes no início de certas aulas (consultar o Planeamento da Unidade Curricular - PUC).? Os mini-testes são realizados obrigatoriamente de modo presencial e terão a duração máxima de 10 minutos.? Os mini-testes serão realizados sem consulta.? Para o cálculo da nota dos mini-testes descarta-se a pior nota obtida nessas avaliações e calcula-se a média aritmética das restantes 2 notas.Sobre os quizzes online:? Serão realizados 2 quizzes online, ao longo do período letivo (consultar o PUC), utilizando-se a plataforma de e-learning Moodle.? Cada quiz poderá ser realizado ao longo de 72 horas. No entanto, após o início cada estudante terá apenas disponíveis 30 minutos para completar a submissão.? Cada aluno dispõe de uma única tentativa para submeter um quiz.
BibliografiaMendes, S., Notas de Álgebra Linear , v1.5 - 2022, disponível na página da UC.Mendes, S., Exercícios de Álgebra Linear , disponível na página da UC.Mendes, S., Introdução ao MATLAB com Aplicações à Álgebra Linear , disponível na página da UC.
Bibliografia OpcionalStrang, G., "Linear Algebra and its Applications" , 4th edition, Cengage Learning, 2006.Blyth,T.S. and Robertson, E.F. "Basic Linear Algebra", Springer, 2002.
Programação
A unidade curricular pretende dotar os estudantes de noções fundamentais de programação e experiência prática, utilizando a linguagem Python. No final, os estudantes terão tomado contacto com primitivas de programação imperativa existentes em várias linguagens, bem como com conceitos básicos de programação orientada para objetos.
ProgramaCP1. Funções e parâmetros
CP2. Variáveis e estruturas de controlo
CP3. Invocação e recursividade
CP4: Procedimentos e input/output
CP5. Objetos e referências
CP6. Classes de objetos
CP7. Objetos compostos
CP8. Classes de objetos compostos
CP9. Vetores
CP10. Matrizes
Programação em Python: Introdução à programação com múltiplos paradigmas: João P. Martins 2013 IST Press
Bibliografia OpcionalTópicos de Matemática I
Apreender os conceitos fundamentais do cálculo diferencial e integral a uma variável, essenciais à formulação e tratamento de problemas colocados no âmbito da ciência dos dados.
Programa1. Sucessões
1.1. Primeiras noções
1.2. Convergência
1.3. Alguns limites e resultados úteis
2. Cálculo diferencial em R
2.1. Breve revisão
2.2. Continuidade e limite
2.3. Diferenciabilidade e fórmula de Taylor
2.4. Métodos numéricos
2.4.1. Método do ponto fixo
2.4.2. Método da bissecção
2.4.3. Método de Newton-Raphson
2.4.4. Derivação numérica
3. Cálculo Integral em R
3.1. Métodos gerais de primitivação
3.2. Cálculo de integrais
3.3. Teorema fundamental da Análise
3.4. Integração numérica
3.4.1. Método do ponto médio
3.4.2. Método dos trapézios
4. Equações diferenciais ordinárias
4.1. Equações de varáveis separáveis
4.2. Equações lineares de 1ª ordem
4.3. Métodos numéricos
4.3.1. Método de Euler
4.3.2. Método de Runge-Kutta (RK4)
Aprovação com classificação não inferior a 10 valores numa das modalidades: - Avaliação periódica: Exame (75%) + trabalhos de grupo sobre cálculo numérico (25%).- Avaliação por Exame (100%), em qualquer uma das épocas de exame.As notas finais superiores a 16 valores sujeitam-se a homologação através de uma prova oral.
Bibliografia[1] Ferreira, J.C., "Introdução à Análise Matemática", Fundação Calouste Gulbenkian.[2] Strang, G., "Calculus", Wellesley-Cambridge Press.[3] Caputo, H.P., Iniciação ao Estudo das Equações Diferenciais, Livros Técnicos e Científicos Editora, S.A.
Bibliografia Opcional[4] Suleman, A., ?Apontamentos de aula? (disponível no e-learnig).[5] Suleman, A., ?Notas elementares sobre o cálculo numérico? (disponível no e-learnig).[6] Santos, M.I.R, ?Matemática computacional? (IST).
Amostragem e Fontes de Informação
Conhecer tipos de informação e fontes de informação relevantes no contexto da Ciência de Dados.
Conhecer noções elementares de amostragem
1. Tipos e Fontes de Informação
2. A Internet como Fonte de Informação
3. Amostragem
4. Designed Data vs Big Data
Regime de avaliação: periódica ou por examePeriódica:- Trabalho em grupo: (40%); - Exame individual (60%);nota mínima 7,5Assiduidade às aulas >=80%.Por exame: idêntica à avaliação periódicaA equipa docente poderá convocar qualquer aluno para uma prova oral no seguimento da realização de qualquer um dos elementos de avaliação.Alunos abrangidos pelo RIIEE deverão contactar o coordenador da UC com vista ao enquadramento dos processos de aprendizagem e avaliação na UC.
BibliografiaGroves, R., Fowler, F., Couper, M., Lepowski, J., Singer, E. & Tourangeau, R. (2009) Survey Methodology, 2nd edition, John Wiley and Sons.Salganik, M. (2018). Bit by Bit- Social Research in the Digital Age. New Jersey: Princeton University Press.Singh, G. (2013) Information Sources, Services and Systems. PHI Learning Private Limited.Vicente, P. (2012). Estudos de mercado e de opinião, Edições Sílabo.Vicente, P., (2021) Apontamentos de apoio à UC de Amostragem e Fontes de Informação.
Bibliografia OpcionalAnálise Exploratória de Dados
Os objetivos gerais (OG) centram-se em capacitar o aluno a adquirir competências para:
OG1: Organizar e preparar os dados para análise.
OG2: Explorar e analisar descritivamente os dados.
OG3: Analisar e representar os dados com recurso. a software adequado à área da Ciência de Dados.
OG4: Aplicar a literacia visual e estatística na criação e interpretação de visualizações de dados.
Conteúdos programáticos (CP) articulados com os objetivos de aprendizagem.
CP1. Organização, preparação e transformação de dados
CP2. Análise exploratória de dados
Valores omissos
Codificação e imputação
Gráficos exploratórios
Variáveis aleatórias
Função de distribuição empírica
Distribuição Normal
CP3. Análise descritiva dos dados
Medidas descritivas
Análise uni e bivariada
Medidas de associação
CP4. Representação visual
Introdução aos princípios de representação visual
Estruturas de representação visual
Regime de avaliação: periódica ou por examePeriódica:- Exercício individual em R (10%) nota mínima 7,5- Trabalho de grupo (35%); nota mínima 7,5- Teste escrito (55%); nota mínima 7,5Por exame: - Exame/trabalho prático individual (40%); nota mínima 7,5- Exame escrito (60%); nota mínima 7,5
BibliografiaBarroso, M., Sampaio, E. & Ramos, M. (2003). Exercícios de Estatística Descritiva para as Ciências Sociais, Lisboa, Sílabo.Brown, D.S. (2022). Statistics and Data Visualization Using R. The Art and Practice of Data Analysis. Sage Publication, Inc.Cairo, A. (2013). The Functional Art: An introduction to information graphics and visualization (Voices That Matter). New Riders.Carvalho, A. (2017). Métodos quantitativos com Excel, Lisboa, Lidel edições técnicas.Reis, E. (1998). Estatística Descritiva, Lisboa, Sílabo,7ª ed.Rocha, M. & Ferreira, P.G. (2017) Análise e Exploração de Dados com R. Lisboa, FCA
Bibliografia OpcionalAlexandrino da Silva, A. (2006). Gráficos e mapas?representação de informação estatística. Lisboa, Lidel edições técnicas. Carvalho, A. (2017). Gráficos com Excel - 95 Exercícios, Lisboa, FCA.Dias Curto, J.J., & Gameiro, F. (2016). Excel para Economia e Gestão. Lisboa, Ed. Sílabo.Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R. London, SAGE Publications Ltd.Hoaglin, D.C., Mosteller, F & Tukey, J. W. (1992). Análise Exploratória de Dados. Técnicas Robustas, Ed. Salamandra, Lisboa.Murteira, B. J. F. (1990). Análise Exploratória de Dados. Estatística Descritiva, McGraw Hill.Reis, E. (1998). Estatística Descritiva, Lisboa, Sílabo.
Estruturas de Dados e Algoritmos
Esta disciplina introduz conceitos importantes de estruturas de dados, de algoritmos e de eficiência algorítmica. Estes conceitos são introduzidos numa perspetiva de desenvolver e encorajar, nos estudantes, o pensamento crítico. Do ponto de vista do desenvolvimento de software, pretende-se uma consolidação do desenvolvimento de software de uma forma estruturada e segundo o paradigma de orientação a objetos.
Serão apresentadas e utilizadas estruturas clássicas de organização de dados (lineares e não-lineares) e algoritmos associados, bem como algoritmos clássicos de procura e estruturação, numa perspetiva de resolver problemas complexos de uma forma eficiente. Caso o tempo o permita, tópicos adicionais poderão ser abordados.
A componente prática de programação (com recurso a uma linguagem de programação, por exemplo, Python) é fortemente encorajada.
CP1: Conceitos fundamentais (algoritmo e programa).
CP2: Tipos Abstratos de Dados e Programação Orientada a Objetos.
CP3: Estruturas de dados lineares: pilhas, filas e listas ligadas.
CP4: Recursão.
CP5: Introdução à análise de algoritmos.
CP6: Estruturas de dados hierárquicas: árvores.
CP7: Grafos.
- J. Wengrow, A Common-Sense Guide to Data Structures and Algorithms, Second Edition. The Pragmatic Bookshelf, 2020.- M. Goodrich, R. Tamassia and M. Goldwasser, Data Structures & Algorithms in Python. Wiley, 2013.
Bibliografia Opcional- B. Miller and D. Ranum, Problem Solving with Algorithms and Data Structures using Python, Second Edition, Release 3.0. 2013.- T, Cormen, C. Leiserson, R. Rivest and C. Stein, Introduction to Algorithms, Fourth Edition. MIT Press, 2022. - Referências adicionais a indicar durante as aulas.
Optimização para Ciência de Dados
No final da Unidade Curricular, o estudante deverá ter adquirido as competências necessárias para listar os principais modelos de programação matemática, formular problemas em programação linear, programação linear inteira e programação não linear, utilizar as metodologias adequadas à sua resolução e interpretar e produzir recomendações com base nas soluções obtidas, numa perspectiva de resolução eficiente de problemas complexos em contextos reais.
ProgramaConteúdos programáticos (CP):
CP1: Programação Linear
CP2: Programação Linear Inteira
CP3: Programação Não Linear
1. Avaliação Periódica: a) Teste Individual (60%); b) Trabalho de Grupo com discussão (40%). A aprovação requere: i) Classificação mínima de 8,5 valores em cada prova; ii) Presença em, pelo menos, 2/3 das aulas.2. Avaliação por exame (1.ª e 2.ª Época): 100%.Em ambos os regimes de avaliação (periódica ou por exame), pode ser exigida uma discussão oral.Escala: 0-20 valores.
Bibliografia- Ragsdale, C.T. (2017). Spreadsheet Modeling and Decision Analysis: A Practical Introduction to Business Analytics. 8th Ed. Cengage Learning.
Bibliografia Opcional- Evans, J. (2021). Business Analytics. 3rd Ed. Global Edition. Pearson.- Hillier, F.S and Lieberman, G.J. (2015). Introduction to Operations Research, 10th Ed., McGraw-Hill.- Ragsdale, C.T. (2001). Spreadsheet Modeling & Decision Analysis: A Practical Introduction to management science. 3rd Ed., South-Western College Publishing.- Wolsey, L.A. (1998). Integer Programming. Wiley.
Tópicos de Matemática II
Apreender conceitos fundamentais do cálculo diferencial e integral a várias variáveis, essenciais à formulação e tratamento de problemas colocados no âmbito da ciência dos dados.
Programa1) Cálculo Diferencial.
1.1. Limites e continuidade
1.2. Derivadas parciais.
1.3. Plano tangente e diferenciabilidade.
1.4. Regra da cadeia.
1.5. Cálculo e classificação de pontos críticos.
1.6. Descida do gradiente.
1.7. Regressão linear.
2) Cálculo Integral.
2.1. Integrais duplos.
2.2. Integrais duplos em coordenadas polares.
2.3. Aplicações: áreas e volumes; densidades e massas; teoria das probabilidade.
Aprovação com classificação não inferior a 10 valores numa das modalidades: - Avaliação periódica: Teste Escrito (80%) + mini-projetos MATLAB (20%). - Avaliação por Exame (100%), em qualquer uma das épocas de exame.
BibliografiaStewart, J. "Cálculo - Volume 2", Tradução da 8ª edição norte-americana (4ª edição brasileira), Cenage Learning, 2017.
Bibliografia OpcionalEscrita de Textos Técnicos e Científicos
Esta unidade curricular tem por objectivo proporcionar aos alunos a aprendizagem de metodologias e procedimentos para a escrita de textos técnicos e científicos.
Programa1. Informação; a redacção; a revisão; a redacção final;
2. Estrutura de um texto técnico e científico;
2.1 Elementos pré-textuais;
2.2 Elementos textuais;
2.3 Elementos pós-textuais;
3. Utilização de elementos ilustrativos da argumentação técnica e científica ou de demonstração empírica;
3.1 Inserção de gráficos, quadros e outros elementos ilustrativos e a normalização dos respectivos títulos, fontes de informação e formas gráficas;
4. Normas de referenciação bibliográfica, citação e anotação;
4.1 Normas nacionais e internacionais. As normas adoptadas para a realização de trabalhos, dissertações e teses no ISCTE-IUL;
4.2 Utilização de software específico para a organização e gestão de bibliografias e produção de textos técnicos e científicos (Biblioscape, biblioexpress e End Note).
1) Avaliação contínua:a) Realização com sucesso do curso online da UC (obrigatório) - a avaliação do curso pressupõe que o estudante atinja 50% ou mais nas respostas aos quizs que tem que fazer em cada módulo.b Exercícios autónomos (inclui participação e feed-back de exercícios desenvolvido sob proposta da docente - 30%c) Elaboração de um trabalho final - 70% da nota final2) Avaliação por exame:Realização de um trabalho de avaliação final - 100%
BibliografiaCargill, M. & O'Connor, P. (2013). Writing Scientific Research Articles (2nd Edition). UK: Wiley-BlackwellGastel, B. & Day, R. A. (2016). How to Write and Publish a Scientific Paper (8th Edition). Santa Barbara, California: GreenwoodLindemann, K. (2018). Composing Research, Communicating Results: Writing the Communication Research Paper. USA: John Wiley & Sons, IncMacagno, Fabrizio & Rapanta, Chrysi (2021). Escrita Académica: Argumentação, Lógica da Escrita, Ideias e Estilo, Artigos e Papers. Pactor. 255 p.Madeira, A. C. & Abreu, M. M. (2004). Comunicar em Ciência? Como redigir e apresentar trabalhos científicos. Lisboa: Escolar EditoraNascimento, Z. & Pinto, J.M. (2001). A Dinâmica da Escrita: Como escrever com êxito. Lisboa: Plátano EditoraPereira, M. G. (2012). Artigos Científicos. Como Redigir, Publicar e Avaliar. Brasil: Guanabara KooganSoares, M. A. (2001). Como Fazer um Resumo. Queluz de Baixo, Barcarena: Editorial Presença
Bibliografia OpcionalBowden, J. (2011). Writing a Report - How to Prepare, Write and Present Really Effective Reports. United Kingdom: Little, Brown Book Group.Brandão, M. L. (2009). Manual para Publicação Científica: Elaborando manuscritos, teses e dissertações. Rio de Janeiro: ElsevierEstrela, E., Soares, M. A. & Leitão, M. J. (2003). Saber escrever saber falar: um guia completo para usar correctamente a língua portuguesa. Lisboa: Publicações Dom QuixoteForsyth, P. (2016). How to Write Reports and Proposals. United Kingdom: Kogan Page, LtdGoins, J. (2012). You Are a Writer (so start ACTIHering, L. & Hering, H. (2010). How to Write Technical Reports: Understandable Structure, Good Design, Convincing Presentation. London, New York: SpringerNG like one). United States of America: Tribe PressHofmann, A. (2016). Scientific Writing and Communication. Papers, Proposals, and Presentations (3rd Edition). Oxford: University PressJúnior, J. M. (2008). Como Escrever Trabalhos de Conclusão de Curso? Instruções para planejar e montar, desenvolver, concluir, redigir e apresentar trabalhos monográficos e artigos. Petrópolis: Editora VozesLipson, C. (2011). Cite Right: A Quick Guide to Citation Styles - MLA, APA, Chicago, the Sciences, Professions and More (2nd Edition). Chicago: University of Chicago PressMunter, M. (2006). Guide to managerial communication: effective business writing and speaking (7th Edition). New Jersey: Prentice HallPereira, A. & Poupa, C. (2008). Como Escrever uma Tese, Monografia ou Livro Científico usando o Word. Lisboa: Edições SílaboWolton, D. (2006). É preciso salvar a comunicação. Casal de Cambra: Caleidoscópio
Pensamento Crítico
- Compreender a importância do pensamento crítico na vida académica e profissional;
- Identificar os elementos de um argumento simples e complexo;
- Analisar argumentos simples e argumentos complexos;
- Reconhecer erros no discurso quotidiano;
- Avaliar a qualidade de argumentos e textos argumentativos;
-Criar argumentos simples e complexos em debate oral e produção escrita.
CP*1 Importância do pensamento crítico
CP2 - Discurso argumentativo
CP3 - Tipos de argumentos e estrutura de argumentos
CP4 - Qualidade dos argumentos e falhas na argumentação
* CP. Conteúdoprogramático
Av. ContinuaTPCs- 15% (1 TPC - 5% + 1 TPC - 10%)Assiduidade/participação - Exercicios em aula + debate grupos- 25%Trab. Final (60%)Épocas de ExamesTrabalho Escrito -100%
BibliografiaBergstrom, Carl T., West, Jevin D., (2020), Calling Bullshit: The Art of Skepticism in a Data-Driven World, Random House - ISBN 10 0525509186 Chatfield, Tom, (2017), Critical Thinking: Your Guide to Effective Argument, Successful Analysis and Independent Study, Sage Ltd - ISBN-10 ? : ? 1473947146Bowell, T., & Kemp, G. (2002). Critical thinking: a concise guide. London: Routledge. Weston, A. (2005). A arte de argumentar. Lisboa: GradivaCottrell, S. (2005). Critical Thinking Skills: Developing effective analysis and argument. New York: Palgrave McMillan.
Bibliografia OpcionalBrookfield, S. (1987). Developing critical thinkers: challenging adults to explore alternative ways of thinking and acting. San Francisco: Jossey-Bass.Morgado, P. (2003). Cem argumentos: A lógica, a retórica e o direito ao serviço da argumentação. Porto: Vida Económica.Paul, R., & Elder, L. (2001). The miniature guide to critical thinking: concepts and tools. Foundation for Critical Thinking.Thayer-Bacon, B.J. (2000). Transforming critical thinking: thinking constructively. New York: Teachers College Press.
Optativa em Competências Transversais 1
Optativa em Competências Transversais 2
Optativa em Competências Transversais 3
Armazenamento para Big Data
A unidade curricular pretende consolidar conhecimentos necessários ao desenvolvimento e manutenção de repositórios de informação de suporte a grandes volumes de dados. Os repositórios são suportados por sistemas de informação distribuídos que lidem com tolerâncias a falhas e grandes volumes de dados.
Programa1. Introdução às Bases de Dados Não Relacionais;
2. Redundância para gerir tolerância a falhas;
3. Distribuição de Dados para gerir grandes volumes de informação;
4. Introdução ao MongoDB;.
5. Desenho de Bases de Dados no MongoDB;
6. Manipulação de estruturas JSON;
7. Extracção de dados no MongoDB.
A UC é avaliada por um teste escrito (100%) que ocorre data Época 1 e que tem nota minima de 7 valores.Até 80% da nota pode ser substituída por avaliações a decorrer durante as aulas.
BibliografiaNoSQL Database: New Era of Databases for Big data Analytics - Classification, Characteristics and Comparison, A B M Moniruzzaman, Syed Akhter Hossain, 2013 (https://arxiv.org/abs/1307.0191)MongoDb Homepage
Bibliografia OpcionalEstatística Computacional
Pretende-se com esta UC revisitar alguns conceitos da Teoria das Probabilidades, introduzir a noção de variável aleatória e as bases necessária para a modelação estatística (estimação e ensaios de hipóteses). Tem-se também como objetivo banalizar a utilização do R, usando este ambiente como ferramenta para ajudar a consolidar os conceitos referidos
ProgramaCP1. Teoria das probabilidades: definições, axiomas, probabilidade condicional, probabilidade total e fórmula de Bayes.
CP2. Variáveis aleatórias (VA) univariadas: f.de probabilidade e densidade, f. distribuição, parâmetros caracterizadores.
CP3. VA univariadas comummente utilizadas: características, propriedades e cálculo de probabilidades. Simulação de observações de v.a. com diferentes distribuições.
CP4. VA bi e multivariadas: f. probabilidade e densidade conjunta, f.de distribuição conjunta, covariância, correlação. Independência entre variáveis aleatórias. Distribuição conjunta de uma amostra aleatória simples.
CP5. Distribuições de amostragem: teorema do limite central e distribuições derivadas da Normal
CP6. Estimação de parâmetros: estimação pontual, propriedades dos estimadores, método de máxima verosimilhança, estimação por intervalos.
CP7. Ensaios de hipóteses: racional, probabilidade de significância. Teste para uma e duas médias; teste do qui-quadrado de independência.
Avaliação periódicaTrabalhos de casa: um pequeno exercício em cada um dos 10 (de 12) dias de aulas, a entregar em 24h. O conjunto de todos os TPC vale 10% da nota finalUm TPC não entregue é cotado com 0 e conta para a média final do instrumento.Nota final do instrumento: média simples das cotações (em %) de cada TPC * 202. Um teste teórico-interpretativo final, peso 60%, nota mínima 9 em 203. Um teste pratico em R final, peso 30%, nota minima 6Avaliação por exame: dois instrumentosUm teste teórico interpretativo final, peso 60%, nota mínima 9Um teste pratico em R final, peso 40%, nota minima 6Condição de aprovação (qualquer um dos regimes): Média final ponderada, arredondada à unidades, de pelo menos 10
Bibliografia[BB1]Kerns, G.J. (2011). IPSUR: Introduction to Probability and Statistics Using R, ISBN: 978-0-557-24979-4, Copyright © 2011 G. Jay Kerns, free copy available at https://www.semanticscholar.org/paper/Introduction-to-Probability-and-Statistics-Using-R-Kerns/b2a2c69237387b4c18871d3137667461ff8ea33f[BB2]Reis, E., Andrade, M., Calapez, T. & Melo, P. (2015). Estatística Aplicada, volume 1. 6ª edição, ISBN 978-972-618-819-3. Lisboa. Edições Sílabo.[BB3]Reis, E., Andrade, M., Calapez, T. & Melo, P. (2016). Estatística Aplicada volume 2, 6ª edição, ISBN 978-972-618-986-2. Lisboa. Edições Sílabo. [BB4]Verzani, J. (2014). Using R for Introductory Statistics, 2nd Edition, Chapman & Hall/CRC
Bibliografia Opcional[BC1]Rohatgi, V.K. and Ehsanes Saleh, A.K. Md (2015). An Introduction to Probability and Statistics, 3rd edition, Wiley Series in Probability and Statistics[BC2]Reis, E., Andrade, M., Calapez, T. & Melo, P. (2012). Exercícios de Estatística Aplicada volume 1. 2ª edição, ISBN 978-972-618-688-5 Lisboa. Edições Sílabo.[BC3]Reis, E., Andrade, M., Calapez, T. & Melo, P. (2014). Exercícios de Estatística Aplicada volume 2. 2ª edição, ISBN 978-972-618-747-9. Lisboa. Edições Sílabo. [BC4]Apontamentos e slides a disponibilizar ao longo do curso.
Fundamentos em Gestão de Bases de Dados
O principal objectivo é dotar os alunos de conhecimentos sólidos sobre matérias nucleares na área das bases de dados ditas convencionais (sistemas de bases de dados suportados por modelos relacionais), nomeadamente: desenho de esquemas relacionais, interrogações suportadas pela linguagem S.Q.L. e gestão de indíces.
ProgramaP1 - Desenho de esquemas relacionais
P1.2 Modelo relacional;
P1.2.1 Relações e chaves primárias
P1.2.2 Chaves estrangeiras e regras de integridade
P1.2.3 Optimizações e índices
P1.2.5 Transacções e concorrência
P2 Linguagem S.Q.L
P2.1 Querys Simples;
P2.2 Funções de Agregação;
P2.3 SubQuerys;
P2.4 Triggers e Stored Procedures;
A avaliação periódica é efectuada através de teste escrito e (opcionalmente) trabalho que não vale mais de 30% da nota. O teste coincide com o exame da 1ª época. Existe um exame de 2ª época para os alunos que reprovem ou queiram melhorar a nota,. O trabalho também pode contar para a primeira época.
Bibliografia-Ramos, P, Desenhar Bases de Dados com UML, Conceitos e Exercícios Resolvidos, Editora Sílabo, 2ª Edição, 2007-Perreira, J. Tecnologia de Base de Dados" FCA Editora de Informática, 1998-Damas, L. SQL - Structured Query Language " FCA Editora de Informática, 2005 (II)http://plsql-tutorial.com/.
Bibliografia Opcional-Date, C.J. "An introduction to Database Systems" Addison-Wesley Publishing Company, sexta edição, 1995 (I.2, I.3, I.4, II);-Booch, G., Rumbaugh, J., Jacobson, I "The Unified Modeling Language User Guide" Addison-Wesley Publishing Company, 1999 (I.1);-Nunes, O´Neill, Fundamentos de UML, FCA, 2002
Introdução A Modelos Dinâmicos
Estudar os modelos de regressão linear simples e múltipla, e os modelos autorregressivos e de média móvel e compreender a diferença entre modelos estáticos e dinâmicos.
ProgramaP1. Modelos de Regressão
P1.1. Correlação
P1.2. Regressão linear simples
P1.3. Regressão linear múltipla
P2. Estimação e inferência, OLS e ML
P3. Pressupostos dos resíduos
P3.1. Testes de hipótese e diagnóstico
P3.2. Casos práticos
P4. Modelos ARMA/ARIMA
P4.1. Operador lag, estacionaridade, teste de raiz unitária, outliers, variáveis dummy
P4.2. Ruído Branco, Modelos ARMA e ARIMA
P4.3. Metodologia de Box-Jenkins, Previsão
P5. Extensões do modelo clássico de regressão
P5.1. Regressão não-linear
P5.2. Regressão dinâmica (ARDL)
P5.3. Casos práticos
P6. Programação básica e computação com R e Python
P7. Aplicações para dados e situações reais
P7.1. Conjunto treino/teste, previsão e forecasting
P7.2. Casos práticos
A avaliação periódica inclui a realização de:a) Teste individual com ponderação de 60%.b) Trabalho de grupo com ponderação de 40%.A avaliação periódica exige a presença em, pelo menos, 80% das aulas.Os alunos em avaliação periódica que não obtenham a nota mínima de 8,5 valores no teste individual e de 10 valores no trabalho deverão realizar um exame final (nota mínima de aprovação: 10 valores).
BibliografiaAlan Agresti, Christine Franklin, and Bernhard Klingenberg, (2018). Statistics: The Art and Science of Learning from Data, Fourth Edition, Pearson.Peter Bruce, Andrew Bruce, and Peter Gedeck, (2020), Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, 2nd Edition, O?Reilly Media, Inc.Robert I. Kabacoff, (2015), R in Action: Data analysis and graphics with R, Second Edition, Manning Publications Co.Christoph Hanck, Martin Arnold, Alexander Gerber and Martin Schmelzer, (2019), Introduction to Econometrics with R, https://www.econometrics-with-r.org/Ficheiros (slides e scripts) da UC a disponibilizar no e-learning/Fenix
Bibliografia OpcionalEric Goh Ming Hui, (2019), Learn R for Applied Statistics, Apress.Roberto Rivera, (2020), Principles of managerial statistics and data science, JohnWiley & Sons, Inc.Rob J Hyndman and George Athanasopoulos, (2018), Forecasting: principles and practice, 2nd Edition, OTexts Melbourne, OTexts.com/fpp2.Daniel J. Denis, (2020), Univariate, Bivariate, and Multivariate Statistics Using R: Quantitative Tools for Data Analysis and Data Science, JohnWiley & Sons, Inc.
Segurança, Ética e Privacidade
Esta UC visa preparar os alunos com os conhecimentos necessários para lidarem com o contexto de segurança, privacidade e proteção de dados, quer pessoais quer corporativos. A UC aborda, numa perspectiva integradora, aspectos relacionados com a ética aplicada no desenvolvimento de algoritmos e tratamento de informação, quadros legais de protecção de dados e da vida privada, e as abordagens técnicas de segurança necessárias para garantir ambientes privados e seguros.
ProgramaCP1.Engenharia da Privacidade
CP2.Estratégias de Desenho da Privacidade
CP3.Técnicas de Privacidade
-Autenticação
-Credenciais baseadas em atributos
-Comunicações Privadas Seguras
-Anonimato e pseudonimato das comunicações
-Privacidade em bases de dados
-Tecnologias para a privacidade do respondente: controle estatístico de divulgação
-Tecnologias para a privacidade do proprietário: mineração de dados com preservação da privacidade
-Tecnologias para a privacidade do utilizador: recuperação de informações privadas
-Privacidade de armazenamento
-Computação que preserva a privacidade
-Técnicas de melhoria da interferência
CP4.Ética e desenvolvimento tecnológico: Ética na computação; Desafios éticos na Ciência de Dados; Responsabilidade na Engenharia.
CP5.Ética normativa: Ética utilitarista, deontológica e das virtudes; Ética aplicada e estudo de casos.
CP6.Privacidade e proteção de dados: O RGPD e a Lei 58/2019; Privacidade e utilidade; Técnicas de anonimização/pseudonimização.
Avaliação periódica:- Realização de dois testes, um a meio do semestre (32,5%) [CP1, CP2, CP3] e outro em 1º época (15%) [CP6].- Realização de trabalho em grupo (15%) [CP1, CP2, CP3]- Realização de trabalho individual (32,5%) [CP4, CP5, CP6]- Assiduidade do aluno nas aulas (5%) [Para obter 100% na componente de assiduidade, o aluno deve frequentar um mínimo de 70% das aulas]Exame Final em 2º época para quem não for aprovado em 1º época:- Prova escrita 100% [CP1, CP2, CP3, CP4, CP5, CP6]
BibliografiaAndress, J. (2014). The Basics of Information Security: Understanding the Fundamentals of InfoSec in Theory and Practice. Syngress.Kim, D., Solomon, M. (2016). Fundamentals of Information Systems Security. Jones & Bartlett Learning.Cannon, J.C. Privacy in Technology: Standards and Practices for Engineers and Security and IT Professionals. Portsmouth: AN IAPP Publication, 2014.Breaux, Travis. Introduction to IT Privacy: A Handbook for Technologists. Portsmouth: An IAPP Publication, 2014.Whitman, M., & Mattord, H. (2013). Management of information security. Nelson Education.Katz, J., & Lindell, Y. (2014). Introduction to modern cryptography. CRC press.Ethics, Technology, and Engineering: An Introduction (2011). Ibo van de Poel, Lamber Royakkers, Wiley-Blackwell.Cordeiro, A.B.N (2020). Direito da Proteção de Dados à luz do RGPD e da Lei n.º 58/2019, Edições Almedina.
Bibliografia OpcionalWhitman, M., Mattord, H. (2017). Principles of Information Security. Course Technology.Bowman, Courtney. The Architecture of Privacy: On Engineering Technologies that Can Deliver Trustworthy Safeguards. O?Reilly Media, 2015.Anderson, R. J. (2010). Security engineering: a guide to building dependable distributed systems. John Wiley & Sons.Zúquete, A. (2018). Segurança em redes informáticas. FCA-Editora de Informática.Regulamentos e orientações da Comissão Europeia relativos à Proteção de Dados, https://ec.europa.eu/info/law/law-topic/data-protection_enBynum, Terrell Ward, and Simon Rogerson, (2004), Computer Ethics and Professional Responsibility: Introductory Text and Readings. Oxford: Blackwell, 2004. Outros textos a indicar e distribuídos pelo docente ao longo do semestre.
Métodos de Aprendizagem Não Supervisionada
Introduzir os principais métodos analíticos não supervisionados na aplicação a problemas reais.
ProgramaCP1: Introdução aos métodos de aprendizagem não supervisionada
CP2: Técnicas de redução da dimensionalidade dos dados
- Análise em componentes principais (ACP)
- Aplicações com R
CP3: Técnicas de clustering:
- Métodos hierárquicos
- Métodos partitivos
- Mapas self-organizing
- Métodos probabilísticos
- Qualidade e validação de soluções de clustering
- Aplicações com R
CP4: Estudos de caso
Os estudantes podem optar por Avaliação Periódica ou Exame Final.AVALIAÇÃO PERIÓDICA:- trabalho de grupo com nota mínima de 8 valores (50%)- teste individual com nota mínima 8 valores (50%)A aprovação requer uma frequência mínima de 80% das aulas e nota mínima de 10.EXAME:O Exame Final corresponde a um exame escrito. Os alunos devem obter uma nota mínima de 10 para passar.
BibliografiaHair, J. F., Black, W. C., Babin, B. J., Anderson, R. E. (2014), Multivariate Data Analysis, 7th Edition, Essex, UK: Pearson Education.James, G., Witten, D., Hastie, T., Tibshirani, R. (2013), An Introduction to Statistical Learning: with applications in R, New York: Springer.
Bibliografia OpcionalAggarwal, C. C., Reddy, C. K. (eds.) (2014), Data Clustering: Algorithms and Applications. Boca Raton: CRC Press.Hennig, C., Meila, M., Murtagh, F., Rocci, R. (eds.) (2016), Handbook of Cluster Analysis, Handbooks of Modern Statistical Methods. Boca Raton: Chapman & Hall/CRC. Kohonen, T. (2001). Self-Organizing Maps. Third edition, Springer.Lattin, J., D. Carroll e P. Green (2003), Analyzing Multivariate Data, Pacific Grove, CA: Thomson Learning.Wedel, M., Kamakura, W. A. (2000), Market Segmentation. Conceptual and Methodological Foundations (2nd edition), International Series in Quantitative Marketing. Boston: Kluwer Academic Publishers.
Métodos de Aprendizagem Supervisionada
Compreender e aplicar a análise supervisionada em tarefas de classificação e regressão.
ProgramaCP1: Sobre Aprendizagem Supervisionada
Tipologias
Dados para aprendizagem
Funções objetivo
Avaliação e seleção de modelos
Notas sobre inferência estatística
CP2: Métodos de Regressão
K- Nearest Neighbor
Árvores de Regressão (algoritmo CART)
CP3: Métodos de Classificação
Naive Bayes
K-Nearest-Neighbor
Regressão Logística
Árvores de Classificação (algoritmo CART)
AVALIAÇÃO PERIÓDICA: - quiz online realizado em grupo (40%) com nota mínima de 9 valores - teste individual (60%) com nota mínima 9 valores. A aprovação requer nota mínima de 10 valores. EXAME: 1ª parte - teste individual (60%) 2ª parte - teste individual online com análises de dados efetuadas com a ferramenta de software usada nas aulas (40%). Os alunos devem obter uma nota mínima de 9 valores em cada parte do exame e nota mínima (ponderada) de 10 valores para aprovação.
BibliografiaGareth, J., Daniela, W., Trevor, H., & Robert, T. (2013). An introduction to statistical learning: with applications in R. Springer.Hastie, T., Tibshirani, R., Friedman, J. H., & Friedman, J. H. (2009). The elements of statistical learning: data mining, inference, and prediction (Vol. 2, pp. 1-758). New York: Springer.Larose, D., Larose, C. (2015). Data Mining and Predictive Analytics. John Wiley & Sons.
Bibliografia OpcionalField, A., Miles, J., & Field, Z. (2012). Discovering statistics using R (2012). Great Britain: Sage Publications, Ltd, 958.
Optimização Heurística
Aprofundar conhecimentos em programação matemática, para abordar problemas de decisão. Nesta Unidade Curricular serão apresentados modelos matemáticos com múltiplos objetivos, heurísticas e metaheurísticas para resolver problemas de otimização. No final do curso, os alunos devem ser capazes de definir heurísticas para problemas específicos, codificá-las e usar o código gerado para resolver instâncias de problemas.
ProgramaConteúdos programáticos (CP):
CP1. OTIMIZAÇÃO MULTIOBJETIVO
1.1. Conceitos básicos
1.2. Metodologias
CP2. METAHEURÍSTICAS
2.1. Conceitos e terminologia
2.2. Algoritmos com uma única solução inicial
2.3. Algoritmos Genéticos
1ª época: i) Trabalhos Individuais (TI): 50% - TI 1: 25% - TI 2: 25% ii) Projeto de Grupo (até 5 estudantes): 50%; Nos Trabalhos Individuais (TI1 e TI2) e no Projeto de Grupo pode ser necessária discussão oral.2ª época i) Projeto Individual: 100% (pode ser necessária discussão oral). Em ambas as épocas, o aluno pode ser sujeito a exame oral mesmo que classificação final >= 9,5 valores.
Bibliografia-Ragsdale, C.T. (2017). Spreadsheet Modeling and Decision Analysis: A Practical Introduction to Business Analytics. 8th Ed. Cemgage Learning.- Burke, E. K.; Kendall, G. (Eds.) (2014). Search Methodologies: Introductory Tutorials in Optimization and Decision Support, 2nd edition, Springer.-Siarry, P. (Ed.) (2016). Metaheuristics, Springer.-Ehrgott, M. (2005). Multicriteria Optimization, 2nd edition, Springer.
Bibliografia Opcional-Open Access documents such as instructor notes, book chapters, research articles, and tutorials that will be provided via Moodle.
Processamento de Big Data
O objetivo geral desta UC é dar formação nas tecnologias, técnicas e algoritmos que permitem extrair modelos e conhecimento a partir de grandes quantidades de dados.
ProgramaCP1: Programação para larga escala
CP2: Aprendizagem automática para larga escala
CP3: Sistemas de recomendação
CP4: Análise de hiperligações
A avaliação pode ser realizada de duas formas: periódica [1] ou exame final [2].[1] A avaliação periódica consiste em:- 1 teste escrito individual com um peso na nota final de 60%, com uma nota mínima de 8 em 20 para obter aprovação na UC;- 1 trabalho (em grupo) com um peso na nota final de 40%.[2] O exame final é composto por parte teórica e prática, realizadas no Iscte-IUL (ver detalhes obrigatórios no campo Observações).
Bibliografia- Mining of Massive Datasets, A. Rajaraman, J. Ullman, 2011, Cambridge University Press.- Big Data: Algorithms, Analytics, and Applications, Kuan-Ching Li et al., Chapman and Hall/CRC, 2015.- Learning Spark: Lightning-Fast Big Data Analysis, Holden Karau, A. Konwinski, P. Wendell and M. Zaharia, O'Reilly Media, 2015.- Advanced Analytics with Spark: Patterns for Learning from Data at Scale, Sandy Ryza et al., O'Reilly Media, 2017.- Practical Data Science with Hadoop and Spark: Designing and Building Effective Analytics at Scale, Ofer Mendelevitch, Casey Stella and Douglas Eadline, Addison-wesley, 2016.
Bibliografia Opcional- All of Statistics: A concise course in Statistical Inference, L.Wasserman, Springer, 2003.- The elements of statistical learning, Trevor Hastie, Robert Tibshirani, and Jerome Friedman. Springer, 2001
Projeto Aplicado em Ciência de Dados I
O objetivo principal deste curso é permitir que os alunos tenham um primeiro contacto em como desenvolver um projeto aplicado em ciência de dados. Baseados em alguns temas, os alunos terão acesso a bases de dados reais sobre as quais terão que trabalhar, nomeadamente: fazer limpeza e pré-processamento dos dados, escolher as visualizações mais apropriadas, elaborar análises estatísticas e/ou implementar os algoritmos adequados, de forma a apresentar soluções e resultados de forma adequada. Dá-se enfase a compreensão do problema em estudo, a interpretação correta dos resultados e a capacidade de transmissão da informação extraída. Para atingir estes objetivos, iremos organizar apresentações, debates, aulas abertas de forma que os skills (soft e técnicos) dos alunos ficam consolidados.
ProgramaCP 1 ? Metodologia para desenvolvimento de um projeto com enfâse em Ciência de Dados.
CP 2 ? Metodologias para comunicação e disseminação de resultados.
CP 3 ? Bibliotecas para manipulação, visualização e tratamento de dados.
CP 4 ? Desenvolvimento do projeto.
Dada a natureza aplicada deste unidade curricular, não existirá avaliação por exame.A avaliação será composta por: 1 - Um teste intercalar ? 25%; 2 ? Apresentações orais: 25%.; 3 ? Projeto com relatório final e apresentação em workshop: 50%.A aprovação requer uma nota mínima ponderada de 10 valores
Bibliografia(1) Artigos científicos em conformidade com os temas específicos aos problemas em que os alunos vão desenvolver o seu projeto (2) Ficheiros (slides, scripts e notebooks) da UC a disponibilizar no e-learning/Fenix(3) Jake VanderPlas (2016), Python Data Science Handbook, O?Reilly Media, Inc. (disponível em https://colab.research.google.com/github/jakevdp/PythonDataScienceHandbook/blob/ master/notebooks/Index.ipynb)(4) Matt Harrison and Theodore Petrou (2020), Pandas 1.x Cookbook, Second Edition, Packt>.
Bibliografia Opcional(1) Wes McKinney (2018), Python for Data Analysis, Second Edition, O?Reilly Media, Inc. (data and scripts: https://github.com/wesm/pydata-book) (2) Suresh Kumar Mukhiya and Usman Ahmed (2020), Hands-On Exploratory Data Analysis with Python, Packt>. (https://github. com/PacktPublishing/hands-on-exploratory-data-analysis-with-python)
Análise de Redes
Esta Unidade Curricular (UC) fornecerá as ferramentas matemáticas e o treino computacional para analisar redes de grande dimensão (por exemplo, redes sociais), abordando conceitos de teoria de grafos e análise de redes. Combina a teoria com a prática computacional usando software para análise e visualização de redes de larga dimensão.
Programa1. Introdução
2. Conceitos Básicos
Elementos de uma rede, subredes, densidade e grau. Redes Bipartidas.
3. Small Worlds
Correlação de Grau. Caminhos e distâncias. Conectividade. Seis Graus de Separação. Coeficientes de Clustering.
4. Hubs e Heterogeneidade de Pesos
Medidas de centralidade, Heterogeneidade baseada no Grau, Robustez, Decomposição de Core e Heterogeneidade de Pesos
5. Redes Aleatórias
Geração de Redes Aleatórias e caracterização. Modelo de Watts-Strogatz, Configuration Model e Modelos de Preferência.
6. Comunidades
Conceitos, Problemas Relacionados, Métodos de Detecção de Comunidades (Remoção de Pontes, Otimização de Modularidade, Propagação de Etiquetas). Métodos de Avaliação.
Duas opções:1.Avaliação Periódica: ?trabalhos de grupo (40%);?mini-testes realizados em aula (10%)? teste final (50%).Nota do teste final >= 7.5;Classificação final: média >= 9.5; Presença em, pelo menos, 2/3 das aulas. 2. Avaliação em Segunda Época:?projecto individual (40%);?exame (60%).Nota do exame >= 7.5;Classificação final: média >= 9.5; Em ambas, se classificação final >=9.5: poderão ser sujeitos a um exame oral.Em ambas, se classificação final >=9.5: poderão ser sujeitos a um exame oral.
BibliografiaMenczer, F., Fortunato, S. and Davis, C. A. (2020). A First Course in Network Science, 1st edition, Cambridge University Press: Cambridge. Barabási, A.-L. (2016). Network Science, 1st edition, Cambridge University Press: Cambridge.
Bibliografia OpcionalNewman, M. (2018). Networks, 2nd edition. Oxford University Press: Oxford.https://kateto.net/wp-content/uploads/2018/03/R%20for%20Networks%20Workshop%20-%20Ognyanova%20-%202018.pdfhttps://cran.r-project.org/web/packages/igraph/igraph.pdfDuring the course, instructor notes and exercises will be provided via Moodle.
Inteligência Artificial Simbólica para Ciência de Dados
Pretende complementar-se a formação dos alunos obtida nas restantes UCs da licenciatura de Ciência dos Dados com técnicas maioritariamente simbólicas de inteligência artificial adaptativa e aprendizagem automática.
Os três principais tópicos do programa são a programação em lógica, tecnologias adaptativas essencialmente simbólicas para representar modelos adaptativos do mundo, e métodos de aprendizagem automática simbólica para aprender modelos do mundo.
Perspetiva Geral da Cadeira: necessidade, vantagens e desvantagens das tecnologias essencialmente simbólicas para a representação e aprendizagem de modelos adaptativos da realidade, e o papel de cada componente do programa nos desideratos da cadeira.
Programação em lógica para representar modelos da realidade e raciocinar com eles.
Representação e raciocínio baseados em conjuntos vagos e em lógica vaga para representar modelos adaptativos essencialmente simbólicos e raciocinar com eles.
Representação e raciocínio baseado em casos para representar modelos adaptativos essencialmente simbólicos e raciocinar com eles.
Introdução à Explainable AI e suas características e domínios de aplicação.
Conceitos de Responsible AI.
Prova escrita individual sobre todo o programa da UC (60%)Trabalho de grupo que consiste na investigação sobre um dos tópicos da UC(40%)Exame (100%)
BibliografiaLogic Programming and Inductive Logic Programming:Ivan Bratko. 2011. Prolog Programming for Artificial Intelligence (4th Edition). Pearson Education Canada (International Computer Science Series).Fuzzy Systems:Guanrong Chen, and Trung Tat Pham. 2005. Introduction to Fuzzy Systems. CRC Press.Case based reasoning:Michael M. Richter, and Rosina Weber. 2013. Case-Based Reasoning. A Textbook. Springer-Verlag Berlin Heidelberg
Bibliografia OpcionalLynne Billard, Edwin Diday. 2007. Symbolic Data Analysis: Conceptual Statistics and Data Mining, John Wiley & Sons, Ltd, Chichester, UK
Interfaces Web para A Gestão de Dados
Preparar o aluno para modelar, desenvolver e utilizar em equipa as ferramentas necessárias para a o desenvolvimento de software em Internet.
ProgramaCP1 [Introdução]
- A história da Web;
- Antigas e atuais linguagens de programação para a Web;
- Standards W3C.
CP2 [Modelação e programação de uma aplicação Web]
- Arquitetura cliente/servidor;
- Arquitetura MVC para a Web;
- Principais linguagens de formatação gráfica para a Web;
- Bibliotecas de formatação gráfica;
- Principais linguagens de programação para a Web;
- Bibliotecas de programação para a Web;
- Introdução à segurança do lado do cliente e do lado do servidor.
CP3 [Acesso a Base de Dados]
- Acesso a Base de Dados a partir da Web;
- Modelo de dados na aplicação Web e correspondente interação com a Base de Dados.
CP4 [Registo e Gestão de Dados]
- Registo de dados da Web em Base de Dados.
- Gestão dos dados.
Dada a natureza prática dos conteúdos lecionados, a avaliação será realizada por projeto. O seu tema deverá estar alinhado com a totalidade ou parte do programa da UC. Exercícios realizados na aula (10%). Projeto (90%, incluindo trabalho de grupo (relatório e software) - 40% e prova oral individual - 50%).Todas as componentes do projeto - proposta, relatório, software e prova oral, são obrigatórias. A classificação mínima para cada componente é de 10 numa escala de 0 a 20.Haverá apenas uma data limite para a entrega do projeto, com exceção dos alunos inscritos em época especial que poderão entregar durante esse período.A presença nas aulas não é obrigatória.Não existe exame final.A melhoria de nota pode ser realizada através de entrega de novo projeto no ano letivo seguinte.
BibliografiaRyan J. (2013). A History of the Internet and the Digital Future. Ed: Reaktion Books. ISBN-13: 978-1780231129Dean J. (2018). Web Programming with HTML5, CSS, and JavaScript. Ed: Jones & Bartlett Learning. ISBN-13: 978-1284091793. ISBN-10: 1284091791.Vincent W. S. (2018). Build websites with Python and Django. Ed: Independently published. ISBN-10: 1983172669. ISBN-13: 978-1983172663.Mitchell, R. (2016). Web Scraping with Python: Collecting Data from the Modern Web. Ed. O'Reilly Media, Inc. ISBN-13: 978-1491910290. ISBN-10: 1491910291.
Bibliografia OpcionalDowney A. B. (2015). Think Python: How to Think Like a Computer Scientist. Ed: O'Reilly Media. ISBN-10: 1491939362. ISBN-13: 978-1491939369.Lambert M. and Jobsen B. (2017). Complete Bootstrap: Responsive Web Development with Bootstrap 4. Ed: Impackt Publishing. ISBN-10: 1788833406. ISBN-13: 978-1788833400.
Modelação Estocástica
Esta UC tem como objetivo analisar as propriedades de um modelo estocástico de forma experimental, através de simulação. Serão estudados os métodos de Monte Carlo, assim como a simulação de sistemas reais via simulação de eventos discretos.
ProgramaCP1. Introdução à Simulação em Ciência de Dados
CP2. Geração de Números Pseudo-Aleatórios
- Método Congruencial Linear; Método da Transformação Inversa; Método da Aceitação/Rejeição; Outras Transformações; Misturas
CP3. Métodos de Monte Carlo em Inferência Estatística
CP4. Métodos de Monte Carlo via Cadeias de Markov (MCMC)
- Cadeias de Markov; Algoritmo Metropolis-Hastings
CP5. Métodos de Reamostragem
- Bootstrapp; Cross-Validation
Cp6. Simulação de Eventos Discretos
A avaliação periódica exige a presença em 2/3 das aulas e inclui:1 - Um trabalho de grupo (25%), com eventual discussão individual;2 - Um mini-teste individual (25%);3 - Um teste final individual (50%). A aprovação requer classificação mínima de 9,5 valores em cada um dos elementos de avaliação eclassificação final mínima (média) de 10 valores.A avaliação pode ser também realizada por exame (100%).
BibliografiaTempl, M. (2016). Simulation for Data Science with R. Packt Publishing Ltd:Birmingham, Uk. Rizzo, M. L. (2008). Statistical Computing with R. Chapman & Hall/CRC.Robert, C. P. and Casella, G. (2010). Introducing Monte Carlo Methods with R. Springer-Verlag.
Bibliografia OpcionalWickham, H. and Grolemund , G. (2017). R for Data Science. O'Reilly Media Inc.
Projeto Aplicado em Ciência de Dados II
Pretende-se prover os estudantes de experiência na aplicação de soluções a problemas concretos, baseados em dados e em variados contextos e domínios. Os estudantes aprenderão a desenvolver um projeto em ciência de dados, em ambiente académico e científico, identificando necessidades, manipulando dados, e identificando as metodologias apropriadas para o problema a resolver. Serão reforçados um conjunto de aspetos, potencialmente relevantes para um projeto com dados (reais) de dimensão considerável, tais como: visualização (geoespacial), métodos de classificação automáticos, balanceamento de dados e overfitting, séries temporais, realçando também a forma correta de comunicação dos resultados. Dá-se preferência ao acolhimento de problemas de docentes/investigadores do Iscte com projetos reais e delimitados.
ProgramaCP1: Introdução de elementos potencialmente relevantes para o desenvolvimento de um projeto
CP2: Introdução aos projetos aplicados em Data Science
CP3: Enquadramento e escolha de metodologia adequada
CP4: Desenvolvimento do projecto com dados de dimensão considerável e preferencialmente reais
CP5: Templates de divulgação de resultados obtidos
Dada a sua natureza, esta UC é feita apenas por avaliação periódica, não contemplando a modalidade de avaliação por exame. A avaliação consiste em duas componentes: a) Exercício online, feito em grupo e com consulta (50%); b) Trabalho de grupo, com escrita de relatório e apresentação oral (50%).Os alunos devem obter uma nota mínima de 9 valores em cada componente. A assiduidade não é requisito essencial de aprovação.
Bibliografia"The Data Science Handbook" 1st Edition. Field Cady (2017), Wiley"Hands - on Machine Learning with R" (2020), Boehmke, B., Greenwell, R., CRC Press."Python Data Science Handbook: Essential Tools for Working with Data" (1st ed.) (2016). Jake VanderPlas. O'Reilly Media, Inc. Conteúdo disponível em: https://jakevdp.github.io/PythonDataScienceHandbook/"Ciência Dos Dados Nas Organizações - Aplicações Em Python" (2017), José Braga de Vasconcelos e Alexandre Barão, FCA Editora"The Elements of Statistical Learning: Data Mining, Inference and Prediction" (2nd Ed.) (2016). Hastie, T., Tibshirani, R., and Friedman, J., Springer. "An Introduction to Statistical Learning with Applications in R" (1st Ed.) (2013). James, G., Witten, D., Hastie, T., and Tibshirani, R., Springer. Outra dependente dos temas e dos problemas específicos que os alunos vão desenvolver nos seus trabalhos de projecto.
Bibliografia Opcional"Making Sense of Data I: A Practical Guide to Exploratory Data Analysis and Data Mining", Second Edition (2014). Glenn J. Myatt and Wayne P. Johnson. Published by John Wiley & Sons, Inc.
Análise da Performance em Gestão
Ser capaz de analisar criticamente e de conceber os sistemas de avaliação de desempenho capazes de promover a melhoria da performance empresarial.
Programa1. Informação financeira para a gestão
2. Análise da performance global: balanced scorecard
3. Descentralização e gestão da performance: tableau de bord de gestão
1) Avaliação periódica: Instrumentos: trabalhos ou casos, individuais/grupo (40%) e teste escrito individual (60%). Aprovação: a) mín. 7,5 valores em cada uma das provas ou conjunto de provas individuais; b) classificação final mín. 10 valores; e, c) assiduidade mínima de 2/3 das aulas.2) Avaliação por exame: teste escrito (100%), com classificação mínima 10 valores.
BibliografiaJordan, H., Neves, J. C., e Rodrigues, J. A. (2021). O Controlo de Gestão - ao Serviço da Estratégia e dos Gestores, 11ª Ed., Áreas Editora.Kaplan, R. S., e Norton, D. P. (2008). The execution premium. Linking strategy to operations for competitive advantage. Harvard Business School Press.
Bibliografia OpcionalProjeto Final Aplicado em Ciência dos Dados
Os estudantes saberão desenvolver um projeto real de ciência de dados em ambiente empresarial ou académico, identificando necessidades e manipulando dados para se obter o conhecimento pretendido pela empresa. Dá-se preferência ao acolhimento direto pelas empresas em projetos reais de preferência no local de trabalho das empresas
ProgramaCP1 ? Introdução aos projetos de Data Science aplicados
CP2 ? Enquadramento na organização
CP3 ? Desenvolvimento do projecto
CP4 ? Templates de divulgação de resultados obtidos
CP5 ? Questões de privacidade e acesso aos dados
A UC tem como única avaliação continua a realização do projecto em empresa ou ISCTE-IUL A classificação final resulta dos seguintes componentes:- Pré-projecto: 5%- Monografia, complexidade, outcome, profundidade: 60%- Processo de desenvolvimento/acompanhamento: 35%A disciplina não tem exame final dado a sua natureza de projeto aplicado a situações reais
BibliografiaField Cady ?The Data Science Handbook? 1st Edition 2017, Wiley. Outra dependente dos temas específicos da monografia e das empresas em que os alunos vão desenvolver os trabalhos de projecto.
Bibliografia OpcionalFoster Provost and Tom Fawcett, ?Data Science for Business: What you need to know about data mining and data-analytic thinking?, 2013, O'Reilly Media
Optativa 1
Optativa 2
Optativas recomendadas
Objetivos
A Licenciatura em Ciência de Dados proporciona:
- uma formação sólida, ao nível dos mais elevados padrões internacionais, que permite retorno de valor à sociedade;
- uma sólida base deontológica para a integração profissional dos licenciados;
- um conjunto de competências para conceber e implementar soluções computacionais para problemas no domínio da recolha, tratamento, modelação e análise de dados;
- competências para trabalho em equipas multidisciplinares e de comunicação, escrita e oral;
- capacidade para empreender e inovar.
Em suma, os objetivos gerais são:
- Dominar os raciocínios computacional e o estatístico;
- Possuir conhecimentos teóricos, metodológicos e práticos em áreas específicas de estatística, investigação operacional, ciências da computação e ciências da informação relevantes para a análise de dados em larga escala;
- Capacidade para aplicar soluções para construção de conhecimento num leque variado de problemas e domínios;
- Desenvolver uma prática profissional regulada por princípios e condutas éticas;
- Adquirir competências necessárias para a elaboração de investigações científicas ou de resolução de problemas no âmbito das várias temáticas associadas.
Um licenciado deverá ter atingido os seguintes objetivos de aprendizagem:
Conhecimentos: teóricos, metodológicos e práticos em áreas particulares de estatística, investigação operacional, ciências da informação e ciências da computação, de aplicação em ciência de dados;
Aptidões - apto a:
- recolher, limpar, transformar e integrar dados de fontes diversas;
- organizar, sumarizar e visualizar informação descritiva e explicativa de dados e resultados;
- selecionar e aplicar de modo eficiente as metodologias mais apropriadas para analisar os dados de que dispõe, bem como inferir, prescrever e prever usando os modelos construídos;
- desenhar e implementar algoritmos numa linguagem generalista;
- perceber o nível de segurança, proteção e privacidade de dados num sistema proposto.
Competências - capaz de:
- completar o ciclo de análise por dados;
- obter e avaliar conhecimento científico;
- trabalhar numa equipa de caráter multidisciplinar e comunicar resultados.
Acreditações
