Repositório da disciplina no semestre 2021-2

Last update: May 13, 2022

Related tags

Text Data & NLP 2021-2

Overview

Avisos!

Nenhum aviso!

Compiladores 1

Este é o Git da disciplina Compiladores 1. Aqui ficará o material produzido em sala de aula assim como tarefas, wiki e discussões. Este arquivo contêm informações básicas sobre a disciplina e o plano de ensino do semestre.

Informações básicas

Curso:: Engenharia de Software
Professor:: Fábio Macêdo Mendes
Disciplina:: Compiladores 1
Semestre/ano:: 02/2020
Carga horária:: 60 h
Créditos:: 04

Ementa

Introdução
Autômatos
Organização e estrutura de compiladores e interpretadores.
Análise léxica.
Expressões Regulares
Análise sintática.
Gramáticas Regulares e Livres de Contexto
Estruturas de Dados e representação interna de código-fonte.
Análise semântica.
Geração de código.
Máquinas abstratas e ambientes de tempo de execução.
Projeto de Compiladores.
Compiladores, Interpretadores e Parsers na Engenharia de Software.

Horário das aulas e atendimento

Aulas teóricas e de exercícios: quartas e sextas-feiras às 14h Atendimento: realizado de forma assíncrona no grupo de Telegram da disciplina

Informações importantes

Este curso utiliza Telegram + GitHub + Microsoft Teams para gerenciar o curso. A comunicação com a turma é feita através do Telegram e os encontros presenciais no Microsoft Teams. Habilite a funcionalidade "Watch" no repositório para receber notificações sobre atualizações.

Github:: https://github.com/compiladores-fga/2021-2
Telegram:: (oculto, enviado por e-mail)
Teams:: (oculto, disponível no grupo de Telegram)

Critérios de avaliação

A avaliação será feita usando um critério de avaliação baseado em capacidades e competências complementada por um mecanismo de avaliação competitiva.

Avaliação por capacidades e competências

A avaliação é baseada no domínio de diversas competências e obtenção de medalhas relacionadas ao conteúdo do curso. A lista de competências está no arquivo COMPETENCIAS.md e a de medalhas em MEDALHAS.md

Cada competência é avaliada com uma nota numérica, onde a pontuação pode ser obtida por vários meios (provas, trabalhos, tutoriais, entre outros). O aluno precisa de uma nota numérica maior ou igual a 10 para ser considerado proficiente em cada uma destas competências.

As competências são itens considerados essenciais para a compreensão da disciplina e todos alunos precisam demonstrar proficiência em todas estas competências para serem aprovados.

Medalhas representam feitos que demonstram conhecimento mais aprofundado sobre os assuntos abordados no curso, além de habilitarem menções mais altas.

A menção final é calculada da seguinte maneira:

MI: Obteve pelo menos metade das competências básicas
MM: Obteve todas as competências básicas menos uma.
MS: Obteve todas as competências básicas e pelo menos 15 medalhas.
SS: Obteve todas as competências básicas e pelo menos 30 medalhas.

Código de ética e conduta

Algumas avaliações serão realizadas com auxílio do computador no laboratório de informática. Todas as submissões serão processadas por um programa de detecção de plágio. Qualquer atividade onde for detectada a presença de plágio será anulada sem a possibilidade de substituição. Não será feita qualquer distinção entre o aluno que forneceu a resposta para cópia e o aluno que obteve a mesma.

As mesmas considerações também se aplicam às provas teóricas e atividades entregues no papel.

Prepare-se

O curso utiliza alguns pacotes e ferramentas para os quais cada estudante deverá providenciar a instalação o mais cedo o possível. O curso requer Python 3.6+ com alguns pacotes instalados:

Pip: Gerenciador de pacotes do Python (sudo apt-get install python3-pip)
Jupyter notebook/nteract/Google colab: Ambiente de programação científica (https://nteract.io)
Lark (pip3 install lark-parser --user): Biblioteca de parsing para Python. (note a ausência do sudo no comando!)
Docker: cria ambientes completamente isolados para teste e validação (sudo apt-get install docker.io)

Já que vamos utilizar o Python, vale a pena instalar as seguintes ferramentas:

virtualenvwrapper: isola ambientes de desenvolvimento
flake8: busca erros de estilo e programação no seu código
black: formatador de código de acordo com o guia de estilo do Python
pytest, pytest-cov: criação de testes unitários
hypothesis: auxilia na criação de testes unitários parametrizados.
Editores de código/IDE: Utilize o seu favorito. Caso precise de uma recomendação, seguem algumas: * PyCharm Educacional - IDE com ótimos recursos de introspecção e refatoração e que adora memória RAM. Possui uma versão livre e uma versão profissional paga, mas que é gratuita para estudantes. * VSCode - um bom meio termo entre uma IDE e um editor de código leve. Criado para Javascript, mas possui bons plugins para Python e várias outras linguagens. * Vi/Vim - herança dos anos 70 que nunca morre ;) Instale os plugins para Python.

DICA: em todos os casos, prefira instalar os pacotes Python utilizando o apt-get ou o mecanismo que sua distribuição fornece e, somente se o pacote não existir, instale-o utilizando o pip. Se utilizar o pip, faça a instalação de usuário utilizando o comando pip3 install <pacote> --user (NUNCA utilize o sudo junto com --user e evite instalar globalmente para evitar problemas futuros com o APT). Melhor ainda: isole o ambiente utilizado em cada disciplina com uma ferramenta como o Virtualenv ou o Poetry.

Linux e Docker

Os comandos de instalação acima assumem uma distribuição de Linux baseada em Debian. Não é necessário instalar uma distribuição deste tipo e você pode adaptar os comandos para o gerenciador de pacotes da sua distribuição (ou o Brew, no caso do OS X). Apesar do Linux não ser necessário para executar a maior parte das tarefas, é altamente recomendável que todos instalem o Docker para compartilharmos ambientes de desenvolvimento previsíveis (por exemplo, eu testarei as submissões em containers específicos que serão compartilhados com a turma). É possível executar o Docker em ambientes não-Linux utilizando o Docker Machine ou o Vagrant. Deste modo, cada aluno deve providenciar a instalação do Docker e Docker Compose na sua máquina.

Bibliografia principal

Dragon Book: Compilers: Principles, Techniques, and Tools, Alfred V. Aho, Monica S. Lam, Ravi Sethi, and Jeffrey D. Ullman, Pearson, 2006. SICP: Structure and Interpretation of Computer Programs, Gerald Jay Sussman and Hal Abelson, MIT Press. (https://web.mit.edu/alexmv/6.037/sicp.pdf)

Material suplementar

Curso de Python: https://scrimba.com/learn/python Curso de Python no Youtube (pt-BR): https://www.youtube.com/watch?v=S9uPNppGsGo&list=PLvE-ZAFRgX8hnECDn1v9HNTI71veL3oW0

Cronograma de atividades

Consultar cronograma.

Obs.: O cronograma está sujeito a alterações.

Repositório da disciplina no semestre 2021-2

Related tags

Overview

Avisos!

Compiladores 1

Informações básicas

Ementa

Horário das aulas e atendimento

Informações importantes

Critérios de avaliação

Avaliação por capacidades e competências

Código de ética e conduta

Prepare-se

Linux e Docker

Bibliografia principal

Material suplementar

Cronograma de atividades

Owner

Meta learning algorithms to train cross-lingual NLI (multi-task) models

this repository has datasets containing information of Uber pickups in NYC from April 2014 to September 2014 and January to June 2015. data Analysis , virtualization and some insights are gathered here

Write Python in Urdu - اردو میں کوڈ لکھیں

NLP applications using deep learning.

LegalNLP - Natural Language Processing Methods for the Brazilian Legal Language

This is a NLP based project to extract effective date of the contract from their text files.

Seq2seq attn - Use the Seq2Seq method to implement machine translation and introduce Attention mechanism to improve the results

Unofficial implementation of Google's FNet: Mixing Tokens with Fourier Transforms

A Multilingual Latent Dirichlet Allocation (LDA) Pipeline with Stop Words Removal, n-gram features, and Inverse Stemming, in Python.

KakaoBrain KoGPT (Korean Generative Pre-trained Transformer)

An automated program that helps customers of Pizza Palour place their pizza orders

Unsupervised intent recognition

Model for recasing and repunctuating ASR transcripts

Open-Source Toolkit for End-to-End Speech Recognition leveraging PyTorch-Lightning and Hydra.

Contains analysis of trends from Fitbit Dataset (source: Kaggle) to see how the trends can be applied to Bellabeat customers and Bellabeat products

TalkNet: Audio-visual active speaker detection Model

BERTAC (BERT-style transformer-based language model with Adversarially pretrained Convolutional neural network)

👄 The most accurate natural language detection library for Python, suitable for long and short text alike

BookNLP, a natural language processing pipeline for books

使用pytorch+transformers复现了SimCSE论文中的有监督训练和无监督训练方法