Skip to content

HW3 建議 #2

@MiccWan

Description

@MiccWan

https://github.com/b07901135/Data_Science_Programming/blob/6693bc21073729821b9e4c315aa4f909bb53303d/w2_thu/test.Rmd

建議

  • tf-idf 是用於區別出多個文本之間的差異(特色),例如將多個文本分類等等。在你的例子裡你將出國留學的文章分成 12 個月來做 tf-idf ,理論上能找出來的是各個月的文章會不會有什麼特色,而像是"美國"、"申請"、"學校"這種每個月都會出現的字自然會被刪掉(因為不會是某個月的特色)。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions