在处理大规模数据导入到neo4j时,尤其是涉及到百万级的数据量,使用合适的导入工具和方法至关重要。以下是一些建议和步骤来解决您遇到的问题:
对于大规模数据导入,Neo4j官方推荐使用
neo4j-import工具。这是一个专为大数据导入设计的高效工具,可以一次性导入节点和关系,而不需要通过REST API或Cypher语句逐条插入数据。
准备数据文件:
neo4j-import的要求。
使用neo4j-import命令:
确保Neo4j数据库为空,因为
neo4j-i只能导入到空数据库。mport
使用以下命令进行导入:
neo4j-admin import --nodes=import/nodes1.csv,import/nodes2.csv --relationships=import/relationships.csv
其中
import/nodes1.csv和
import/nodes2.csv是您的节点文件,
import/relationships.csv是关系文件。
启动Neo4j数据库:
file:///d:/csv/company.csv。
节点文件(nodes1.csv):
id:ID,name 1,Node1 2,Node2 ...
节点文件(nodes2.csv):
id:ID,name 1,NodeA 2,NodeB ...
关系文件(relationships.csv):
:start_id,:end_id,:TYPE 1,1,REL_TYPE 2,2,REL_TYPE ...
通过以上方法,您应该能够高效地将90万和500万的节点以及150万的关系导入到Neo4j数据库中。