MongoDB 安装及文档的基本操作

Wesley13
• 阅读 515

MongoDB 安装及文档的基本操作

前言

MongoDB 是一个基于分布式文件存储的半结构化的非关系型数据库。在海量数据中,可以较高性能的处理存取操作。它是以 BSON 格式进行数据存储(类似 JSON 格式,但类型更为丰富),因此对于复杂的数据类型,可以较轻松的保存和处理。同时,在非关系型数据库阵容中,相比其他数据库产品,它拥有更丰富的功能,并且与关系型数据库类型,所以对于新手使用也能快速上手。

安装

环境:CentOS 7 版本号:4.2.6 企业版 版本:免安版(TGZ)

安装包

访问官网链接下载链接:https://www.mongodb.com/download-center/enterprise

我这里使用的是企业版,下载选项如图:

MongoDB 安装及文档的基本操作

下载后得到压缩包 mongodb-linux-x86_64-enterprise-rhel70-4.2.6.tgz

将下载的压缩包上传至对应目录,然后进行解压

> tar -zxvf mongodb-linux-x86_64-enterprise-rhel70-4.2.6.tgz

配置文件

当前使用的是免安版,所以 mongoDB 的配置文件需要自己手动创建。如果使用的是安装版,安装后配置文件会在 /etc/mongod.conf 中。

创建配置前,先创建 data、log、run 三个目录,分别对应的数据存储目录、日志目录、进程 ID 保存目录

> mkdir -p /var/mongodb/data
> mkdir -p /var/mongodb/log
> mkdir -p /var/mongodb/run

创建 mongod.conf 在 /var/mongodb 目录中,内容如下:

# mongod.conf

# for documentation of all options, see:
#   http://docs.mongodb.org/manual/reference/configuration-options/

# where to write logging data.
systemLog:
  destination: file
  logAppend: true
  path: /var/mongodb/log/mongo.log # 日志文件路径设置

# Where and how to store data.
storage:
  dbPath: /var/mongodb/data # 数据存储路径
  journal:
    enabled: true
#  engine:
#  wiredTiger:

# how the process runs
processManagement:
  fork: true  # fork and run in background
  pidFilePath: /var/mongodb/run/mongod.pid  # location of pidfile  
  timeZoneInfo: /usr/share/zoneinfo

# network interfaces
net:
  port: 27017 # 端口号
  bindIp: 127.0.0.1  # 监听 IP ,即可访问 IP,默认是本机


security:
  authorization: enabled
  
#operationProfiling:

#replication:

#sharding:

## Enterprise-Only Options

#auditLog:

#snmp:

配置文件常用基本属性:

属性

说明

systemLog#destination

日志输出位置,file 或 syslog,使用 file 时,必须指定 path

systemLog#logAppend

当实例启动时日志是否追加写入到现有日志中

systemLog#path

日志存放路径

storage#dbPath

数据存储路径

storage#journal#enabled

日志是否永久性,可以用来恢复数据

processManagement#fork

是否后台运行服务

processManagement#pidFilePath

pid 文件的存储路径

processManagement#timeZoneInfo

数据库使用的时区路径

net#port

数据使用的端口

net#bindIp

监听客户端连接的 IP,即可访问的 IP

security#authorization

是否启动权限管控

服务启停

将解压后的安装包 bin 路径添加到环境变量 /etc/profile 中,在 PATH 上进行追加

# mongoDB
PATH=$PATH:/usr/local/software/mongoDB/mongodb-linux-x86_64-enterprise-rhel70-4.2.6/bin

使用 /var/mongodb/mongod.conf 配置文件启动:

> mongod -f /var/mongodb/mongodb.conf

如图所示,则启动成功

MongoDB 安装及文档的基本操作

启动完成后,验证是否正常运行

> mongo

如果正常运行,则进入登录页面

MongoDB 安装及文档的基本操作

创建账号,并设置角色为 root

> use admin
> db.createUser({user:"xxxx",pwd:"xxxxxx",roles:["root"]})

设置账号后,重新登录,此时需要进行账号权限校验

> mongo -u accont -p password

停止 MongoDB 服务,必须切换到 admin 数据库

> use admin
> db.shutdownServer()

基本操作

在介绍几本操作之前,现将常用的 MongoDB 对象与关系型数据库进行类比,便于更好理解 MongoDB 对象。

MongoDB

关系型数据库

Database(数据库)

Database(数据库)

Collection(集合)

Table(表)

Document(文档)

Row(行)

Field(字段)

Column(列)

Database 的操作

数据创建和选择,都是使用use db命令

查看所有数据库

> show dbs

删除数据库,先选择再删除

> use db
> db.dropDatabase()

Collection 的操作

创建集合命令,同时,如果没有先创建集合,插入数据时会自动创建集合

> db.createCollection(collectionName, [options])

其中options为可选参数,主要是数据的校验规则,这里不展开分析。

查看数据库中所有集合

> show collections

选择集合

> db.getCollection(collectionName)
或
> db.collectionName

删除集合

> db.collectionName.drop()

插入

MongoDB 插入方法有 insertOne()、insertMany()、insert()、save() 。其中 insert() 功能就包括了 insertOne() 和 insertMany() 功能。

insertOne

insertOne() 是向数据库中插入一个文档,语法格式为:

db.collect.insertOne(
    <document>,
    {
        writeConcern: <document>
    }
)

指令 insertOne() 中参数:

  • document 参数为 插入的 BSON 数据
  • writeConcern 为写入策略,是可选参数

向 MongoDB 的 ytao 数据库中,插入一条 article 集合的数据

db.article.insertOne(
    {
        title: "Dubbo 负载均衡的实现",
        url: "https://ytao.top/2020/05/02/23-dubbo-loadbalance/",
        author: "ytao"
    }
)

数据库数据为:

MongoDB 安装及文档的基本操作

注意: 如果插入数据时,没指定 _id ,则会自动生成 _id ;如果指定 _id ,则必须 _id 在数据库中存在,否则会报错插入失败。

insertMany

insertMany() 方法是一次插入多个文档,语法格式为:

db.collect.insertMany(
    [<document 1>, <document 2>],
    {
        writeConcern: <document>,
        ordered: <boolean>
    }
)

参数ordered为是否有序插入文档,可选参数,默认 true。

向 MongoDB 的 ytao 数据库中,插入了两条 article 集合的数据

db.article.insertMany(
    [
    {
        title: "Netty中粘包/拆包处理",
        url: "https://ytao.top/2019/12/09/10-netty/",
        author: "ytao"
    },
    {
        title: "WebSocket实现Web端即时通信",
        url: "https://ytao.top/2019/11/17/7_websocket/",
        author: "ytao"
    }
    ]
)

插入后的数据

MongoDB 安装及文档的基本操作

同理,与 insertOne() 相同,插入重复插入已存在的 _id ,否则报错。

insert

insert() 可以插入单个或多个文档,这个也是最较为常用的方法,其语法为

db.collect.insert(
    <document> or [<document 1>, <document 2>],
    {
        writeConcern: <document>,
        ordered: <boolean>
    }
)

插入的文档如果是单个,则类似 insertOne() 的插入方式;如果插入的文档是多个,则类似 insertMany() 的插入方式。其中参数 writeConcern 和 ordered 都是一样。

save

save() 也可以进行数据插入,当新插入的 _id 存在时,会将已存在的文档进行覆盖,如果 _id 不存在时,则类似 insertOne() 的方式插入。其操作语法:

db.collect.save(
    <document>,
    {
        writeConcern: <document>
    }
)

更新

进行更新的方法有 ** updateOne()、updateMany()、update()、replaceOne() 以及 save() **。其中 update() 包括 updateOne() 和 updateMany() 的功能。

update

通过 update() 可以更新一个或多个文档,其语法:

db.collection.update(
    <query>,
    <update>,
    {
        upsert: <boolean>,
        multi: <boolean>,
        writeConcern <document>,
        collation: <document>,
        arrayFilters: [<filter1>,<filter2>]
    }
)

update 的参数:

  • query:要更新文档的查询条件
  • update:要更新的字段
  • upsert:默认为 false。当设置 true 时,如果更新的条件没有匹配到数据时,则插入此更新条件。反之,设为 false 时,则不插入。
  • multi:默认为 false。当查询条件匹配到多条数据时,如果设置为 true,则会更新所有匹配的数据;如果设置为 false,则更新匹配出的第一条数据。
  • writeConcern:和上面 insert 的参数一样。
  • collation:更新数据的排序规则。
  • arrayFilters:更新数据中数组格式数据的某个特定元素。

接下来就演示两个例子,一个普通更新,一个带使用 arrayFilters 数据的更新,这个比较难说明,但通过例子就容易理解。

更新前数据:

{
    "_id" : ObjectId("5ed299cee89845fb9ec805e4"),
    "title" : "WebSocket实现Web端即时通信",
    "url" : "https://ytao.top/2019/11/17/7_websocket/",
    "author" : "ytao"
}

案例一author数据更新为["杨滔", "ytao"]

db.article.update(
    {title: "WebSocket实现Web端即时通信"},
    {$set: {author: ["杨滔", "ytao"]}}
)

案例二author数据["杨滔", "ytao"]杨滔更新为YangTao

db.article.update(
    {title: "WebSocket实现Web端即时通信"},
    {$set: {"author.$[idx]": "YangTao"}},
    {
        arrayFilters:[
            {"idx": {$eq: "杨滔"}}
        ]
    }
)

上面idx表示数组中元素的位置。

更新后的数据

MongoDB 安装及文档的基本操作

updateOne

updateOne() 只能更新一个文档,和 update() 使用类似,将multi参数值为 false 一样,这里不再使用案例演示。

语法:

db.collection.updateOne(
   <filter>,
   <update>,
   {
     upsert: <boolean>,
     writeConcern: <document>,
     collation: <document>,
     arrayFilters: [ <filterdocument1>, ... ],
     hint:  <document|string> 
   }
)

hint4.2.1版本中新增的参数,用于指定更新文档的索引。

updateMany

updateMany() 同样和 update() 更新多个文档使用一样。

语法:

db.collection.updateMany(
   <filter>,
   <update>,
   {
     upsert: <boolean>,
     writeConcern: <document>,
     collation: <document>,
     arrayFilters: [ <filterdocument1>, ... ],
     hint:  <document|string> 
   }
)

replaceOne

replaceOne 将一个文档完全覆盖,并且不需要指定 _id。只能覆盖一个文档。

语法:

db.collection.replaceOne(
   <filter>,
   <replacement>,
   {
     upsert: <boolean>,
     writeConcern: <document>,
     collation: <document>,
     hint: <document|string> 
   }
)

save

save() 在更新中是指定 _id 的方式进行文档覆盖。即上文插入中的 save() 用法。

删除

删除文档的方法有 deleteOne()、deleteMany()、remove()

deleteOne

deleteOne() 一次只能删除一个文档,其语法:

db.collection.deleteOne(
   <filter>,
   {
      writeConcern: <document>,
      collation: <document>
   }
)

filter为删除文档的过滤条件。

deleteMany

deleteMany() 一次可删除多个匹配到的文档,其语法:

db.collection.deleteMany(
   <filter>,
   {
      writeConcern: <document>,
      collation: <document>
   }
)

remove

remove() 是删除查询出的文档,其语法有两个:

db.collection.remove(
   <query>,
   <justOne>
)

或者

db.collection.remove(
   <query>,
   {
     justOne: <boolean>,
     writeConcern: <document>,
     collation: <document>
   }
)

justOne参数默认为 false,表示删除全部匹配到的数据;true 表示只删除第一个文档

查询

MongoDB 中常用的基本查询有 ** findOne() ** 和 ** find() **。

findOne

findOne() 只返回匹配到的第一个文档,语法为:

db.collection.findOne(
    <query>, 
    <projection>

)

参数说明:

  • query 表示查询条件。
  • projection 表示返回的字段(Field)。

下面查询一个文档,并且只返回titleurl

MongoDB 安装及文档的基本操作

通过指定字段的 value 为 1,即表示查询后返回的字段。

find

find() 是返回所有匹配到的集合,语法为:

db.collection.find(
    <query>, 
    <projection>

)

下面案例查询查询结果:

MongoDB 安装及文档的基本操作

总结

本文对 MongoDB 的入门和基本操作进行了简单的了解,在这使用过程中,有点类似关系型数据库操作的影子,所以对有关系型数据库使用经验的人,上手是较为简单的。

更多使用操作,官方文档:https://docs.mongodb.com/manual/reference/

推荐阅读

《ElasticSearch之安装及基本操作API》

《Redis5新特性Streams作消息队列》

《基于Docker实现MySQL主从复制》

《Java 线程通信之 wait/notify 机制》

关注公众号 『ytao』 坚持原创技术文章输出,专注但不限于 Java 相关技术。

MongoDB 安装及文档的基本操作

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Jacquelyn38 Jacquelyn38
2年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Stella981 Stella981
2年前
Python3:sqlalchemy对mysql数据库操作,非sql语句
Python3:sqlalchemy对mysql数据库操作,非sql语句python3authorlizmdatetime2018020110:00:00coding:utf8'''
Easter79 Easter79
2年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
2年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
2年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
2年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
3个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这