FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6267, 301 aa
1>>>pF1KE6267 301 - 301 aa - 301 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.9752+/-0.000839; mu= 17.2285+/- 0.050
mean_var=61.9687+/-12.729, 0's: 0 Z-trim(106.7): 26 B-trim: 562 in 1/48
Lambda= 0.162925
statistics sampled from 9131 (9152) to 9131 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.647), E-opt: 0.2 (0.281), width: 16
Scan time: 1.710
The best scores are: opt bits E(32554)
CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 ( 301) 1981 474.0 5.9e-134
CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 ( 295) 960 234.1 1e-61
CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 ( 292) 937 228.6 4.3e-60
CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 ( 230) 846 207.2 9.6e-54
CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 ( 342) 802 197.0 1.7e-50
CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 ( 256) 656 162.6 2.9e-40
CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 ( 257) 656 162.6 2.9e-40
CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 ( 216) 615 152.9 2e-37
>>CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 (301 aa)
initn: 1981 init1: 1981 opt: 1981 Z-score: 2518.4 bits: 474.0 E(32554): 5.9e-134
Smith-Waterman score: 1981; 99.7% identity (100.0% similar) in 301 aa overlap (1-301:1-301)
10 20 30 40 50 60
pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFTMFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFTMFL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 AGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGATYV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 AGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGATYV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 LYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAILDR
::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LYHDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAILDR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 RNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSAGNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSAGNG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 WWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELETPASAQMLECK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 WWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELETPASAQMLECK
250 260 270 280 290 300
pF1KE6 L
:
CCDS10 L
>>CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 (295 aa)
initn: 958 init1: 958 opt: 960 Z-score: 1221.6 bits: 234.1 E(32554): 1e-61
Smith-Waterman score: 960; 50.4% identity (80.1% similar) in 276 aa overlap (14-289:16-290)
10 20 30 40 50
pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFTM
: ..: ::.. :.::::.:.:..: : ::::. : :. .:.
CCDS10 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 FLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGAT
.. :.::..::::.:.:::.:.::: :::::. ::. : :::.:. .:.:.:: .....
CCDS10 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE6 YVLYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAIL
. .:::.:....::.: ..: . :: :::::::::::: :.: :::..: .:.. ..::.
CCDS10 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE6 DRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSAG
: :: :.: ::::...:.::.... :.: : : .::::::.::::: .:::: ::: ::
CCDS10 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE6 NGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELETPASAQMLE
:..::.:::.:::::..: : :.. .:::: :. . ... : . :
CCDS10 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPE-PDSVFKTEQSEDKPEKYELSVIM
250 260 270 280 290
300
pF1KE6 CKL
>>CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 (292 aa)
initn: 984 init1: 924 opt: 937 Z-score: 1192.4 bits: 228.6 E(32554): 4.3e-60
Smith-Waterman score: 937; 50.5% identity (78.9% similar) in 279 aa overlap (11-284:14-289)
10 20 30 40 50
pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFT
: :.: : : :: ::: ::...:... :.:::.: : :.:.:.:
CCDS65 MGRQKELVSRCGEMLHIRYR--LLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLT
10 20 30 40 50
60 70 80 90 100 110
pF1KE6 MFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGA
. :: ..:::..: ..:.::::::::: ..:::...: ::.::::: :.: :.:: ..:
CCDS65 INLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE6 TYVLYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAI
.. :::::. ... ..: :.::. ::.::::::. .:.. :::.:: .::. ::: .:::
CCDS65 VFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE6 LDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSA
.: :. :: ::: .::...:..: ::: : : .:::::.:::::: .:::: ::..
CCDS65 VDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTT
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE6 GNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQD-----LVSAQHKASELETPA
:. :::::.:.::.:. .:. .:::... : : : :... :. ..::
CCDS65 GQHWWWVPIVSPLLGSIAGVFVYQLMIGCHL-EQPPPSNEEENVKLAHVKHKEQI
240 250 260 270 280 290
300
pF1KE6 SAQMLECKL
>>CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 (230 aa)
initn: 844 init1: 844 opt: 846 Z-score: 1078.3 bits: 207.2 E(32554): 9.6e-54
Smith-Waterman score: 846; 52.2% identity (81.9% similar) in 226 aa overlap (64-289:1-225)
40 50 60 70 80 90
pF1KE6 LMLLTQGAVAQAVTSGETKGNFFTMFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVG
.::..::::.:.:::.:.::: :::::. :
CCDS81 MAVAMAIYVAGGVSGGHINPAVSLAMCLFG
10 20 30
100 110 120 130 140 150
pF1KE6 RLPWVKLPIYILVQLLSAFCASGATYVLYYDALQNYTGGNLTVTGPKETASIFATYPAPY
:. : :::.:. .:.:.:: ...... .:::.:....::.: ..: . :: :::::::::
CCDS81 RMKWFKLPFYVGAQFLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPY
40 50 60 70 80 90
160 170 180 190 200 210
pF1KE6 LSLNNGFLDQVLGTGMLIVGLLAILDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPL
::: :.: :::..: .:.. ..::.: :: :.: ::::...:.::.... :.: : : .
CCDS81 LSLANAFADQVVATMILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAM
100 110 120 130 140 150
220 230 240 250 260 270
pF1KE6 NPARDLGPRLFTYVAGWGPEVFSAGNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPE
::::::.::::: .:::: ::: :::..::.:::.:::::..: : :.. .:::: :.
CCDS81 NPARDLSPRLFTALAGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPE-PD
160 170 180 190 200
280 290 300
pF1KE6 PAQDLVSAQHKASELETPASAQMLECKL
. ... : . :
CCDS81 SVFKTEQSEDKPEKYELSVIM
210 220 230
>>CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 (342 aa)
initn: 805 init1: 712 opt: 802 Z-score: 1019.9 bits: 197.0 E(32554): 1.7e-50
Smith-Waterman score: 802; 43.3% identity (76.2% similar) in 261 aa overlap (20-280:33-292)
10 20 30 40
pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSG
..:. ::::....:.:.. :.::. : .
CCDS65 QASGHRRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVLN-
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE6 ETKGNFFTMFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLL
. :... . :. ...::....:.: .::::.: : ..: : .::.:: :.:.:.: :.:
CCDS65 KKYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQFL
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE6 SAFCASGATYVLYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGM
..: :... : :.: :. ...::.: :::: ::.::::: ...: :::... :::
CCDS65 GSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLTGM
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE6 LIVGLLAILDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAG
: . :.:: :..:. . : : .:.:.:.. .:.:.: : : .::.::: ::.::..::
CCDS65 LQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIAG
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE6 WGPEVFSAGNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELE
:: .::: :..::::::::::.:: .: : .... :. : .: :.
CCDS65 WGKQVFSNGENWWWVPVVAPLLGAYLGGIIYLVFIGSTIPREPLKLEDSVAYEDHGITVL
250 260 270 280 290 300
290 300
pF1KE6 TPASAQMLECKL
CCDS65 PKMGSHEPTISPLTPVSVSPANRSSVHPAPPLHESMALEHF
310 320 330 340
>>CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 (256 aa)
initn: 637 init1: 583 opt: 656 Z-score: 836.3 bits: 162.6 E(32554): 2.9e-40
Smith-Waterman score: 656; 43.1% identity (77.8% similar) in 216 aa overlap (20-235:32-246)
10 20 30 40
pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSG
..:. ::::....:.:.. :.::. : .
CCDS83 GSGHCLRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVLN-
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE6 ETKGNFFTMFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLL
. :... . :. ...::....:.: .::::.: : ..: : .::.:: :.:.:.: :.:
CCDS83 KKYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQFL
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE6 SAFCASGATYVLYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGM
..: :... : :.: :. ...::.: :::: ::.::::: ...: :::... :::
CCDS83 GSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLTGM
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE6 LIVGLLAILDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAG
: . :.:: :..:. . : : .:.:.:.. .:.:.: : : .::.::: ::.::..::
CCDS83 LQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIAG
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE6 WGPEVFSAGNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELE
:: .::
CCDS83 WGKQVFRYCPCPGPFL
250
>>CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 (257 aa)
initn: 637 init1: 583 opt: 656 Z-score: 836.3 bits: 162.6 E(32554): 2.9e-40
Smith-Waterman score: 656; 43.1% identity (77.8% similar) in 216 aa overlap (20-235:33-247)
10 20 30 40
pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSG
..:. ::::....:.:.. :.::. : .
CCDS83 QASGHRRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVLN-
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE6 ETKGNFFTMFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLL
. :... . :. ...::....:.: .::::.: : ..: : .::.:: :.:.:.: :.:
CCDS83 KKYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQFL
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE6 SAFCASGATYVLYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGM
..: :... : :.: :. ...::.: :::: ::.::::: ...: :::... :::
CCDS83 GSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLTGM
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE6 LIVGLLAILDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAG
: . :.:: :..:. . : : .:.:.:.. .:.:.: : : .::.::: ::.::..::
CCDS83 LQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIAG
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE6 WGPEVFSAGNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELE
:: .::
CCDS83 WGKQVFRYCPCPGPFL
250
>>CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 (216 aa)
initn: 611 init1: 583 opt: 615 Z-score: 785.3 bits: 152.9 E(32554): 2e-37
Smith-Waterman score: 615; 42.8% identity (73.6% similar) in 208 aa overlap (53-256:8-215)
30 40 50 60 70 80
pF1KE6 QCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFTMFLAGSLAVTIAIYVGGNVSGAHLN
:... . :. ...::....:.: .::::.:
CCDS83 MVLNKKYGSYLGVNLGFGFGVTMGVHVAGRISGAHMN
10 20 30
90 100 110 120 130 140
pF1KE6 PAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGATYVLYYDALQNYTGGNLTVTGPKET
: ..: : .::.:: :.:.:.: :.:..: :... : :.: :. ...::.: :::: :
CCDS83 AAVTFANCALGRVPWRKFPVYVLGQFLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVAT
40 50 60 70 80 90
150 160 170 180 190 200
pF1KE6 ASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAILDRRNKGVPAGLEPVVVGMLILALG
:.::::: ...: :::... :::: . :.:: :..:. . : : .:.:.:.. .:
CCDS83 AGIFATYLPDHMTLWRGFLNEAWLTGMLQLCLFAITDQENNPALPGTEALVIGILVVIIG
100 110 120 130 140 150
210 220 230 240 250
pF1KE6 LSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFS----AGNGWWWVPVVAPLVGATVGTA
.:.: : : .::.::: ::.::..:::: .:: : : :. :: .:. :
CCDS83 VSLGMNTGYAINPSRDLPPRIFTFIAGWGKQVFRWHHLPGLHWLHHPTGAPEIGGFCGV
160 170 180 190 200 210
260 270 280 290 300
pF1KE6 TYQLLVALHHPEGPEPAQDLVSAQHKASELETPASAQMLECKL
301 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 11:37:58 2016 done: Tue Nov 8 11:37:58 2016
Total Scan time: 1.710 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]